Py学习  »  Python

CausalML创始人赵振宇:基于Python的开源框架玩转因果学习 | 周日直播·因果科学读书会

集智俱乐部 • 2 年前 • 172 次点击  


导语


基于融合机器学习和因果推断方法的因果学习已逐渐成为研究领域和业界应用的一个热点区域。在这个方向,我们希望有类似sklearn之于机器学习那样好用的工具包,可以帮助我们简单的应用各个模型。本周日上午9点,读书会邀请到CausalML创始团队的赵振宇,为我们介绍CausalML作为一个基于Python的开源项目的发展历程,核心方法,以及应用场景。

由智源社区、集智俱乐部联合举办的因果科学与Causal AI读书会第三季,其目标是:将主要结合因果推断的潜在结果(Potential Outcomes)框架展开讨论,并尝试在不同领域,包括但不限于医学、经济学、机器学习等领域,尝试建立与SCM的对应关系。读书自2021年10月24日开始,每周日上午 09:00-11:00举办,持续时间预计 2-3 个月。






背景




因果学习(causal learning)是一个融合了因果推断和机器学习的领域,包含很多方法,其中uplift模型是一个重要方法,在业界有着丰富的应用场景。早在2018年,Uber的数据科学团队面临需要uplift模型解决的问题,在没有找到合适的开源工具包的情况下,开发了CausalML,随后作为开源项目提供给更广泛的社区使用,也吸引来更多的开发者完善了这个工具包。目前,CausalML已有超过60万的下载量,开源项目组也在持续维护和升级这个工具包。


CausalML最初是为了解决什么问题而建设的?其中包含哪些方法?可以应用于哪些场景?希望通过这次分享,让大家了解到更多的关于CausalML的信息和用法。





内容简介




这次分享主要分为五个部分:
  1. CausalML缘起:CausalML最初是如何建立起来的?
  2. 主要模块:CausalML内包含什么模型?什么是uplift模型?有哪些CausalML特有的方法?
  3. 实操Demo: 通过一些代码案例,介绍如何使用CausalML
  4. 应用场景:CausalML可以应用于实践中哪些场景?
  5. 总结和展望:CausalML未来的发展方向有哪些?欢迎大家参与共建,或分享使用CausalML的故事和案例!





主讲人 




赵振宇,腾讯数据科学总监。先后在Yahoo,Uber,腾讯任职。负责实验、因果推断、机器学习、产品分析、平台建设、开源软件、应用研究方面的工作。CausalML发起者之一,《关键迭代可信赖的线上对照实验》译者之一。


参考文献

工具包Git:
https://github.com/uber/causalml
参考文献(优先选读14、15、16):
[1] Ahmed Alaa and Mihaela Schaar. Limits of estimating heterogeneous treatment effects: guidelines for practical algorithm design. In International Conference on Machine Learning, 129–138. 2018.
[2] Susan Athey and Guido Imbens. Recursive partitioning for heterogeneous causal effects. Proceedings of the National Academy of Sciences, 113(27):7353–7360, 2016.
[3] Susan Athey, Julie Tibshirani, Stefan Wager, and others. Generalized random forests. The Annals of Statistics, 47(2):1148–1178, 2019.
[4] Susan Athey and Stefan Wager. Efficient policy learning. arXiv preprint arXiv:1702.02896, 2017.
[5] Pierre Gutierrez and Jean-Yves Gerardy. Causal inference and uplift modeling a review of the literature. JMLR: Workshop and Conference Proceedings 67, 2016.
[6] Jason Hartford, Greg Lewis, Kevin Leyton-Brown, and Matt Taddy. Deep iv: a flexible approach for counterfactual prediction. In Proceedings of the 34th International Conference on Machine Learning-Volume 70, 1414–1423. JMLR. org, 2017.
[7] Guido W Imbens and Jeffrey M Wooldridge. Recent developments in the econometrics of program evaluation. Journal of economic literature, 47(1):5–86, 2009.
[8] Sören R Künzel, Jasjeet S Sekhon, Peter J Bickel, and Bin Yu. Metalearners for estimating heterogeneous treatment effects using machine learning. Proceedings of the National Academy of Sciences, 116(10):4156–4165, 2019.
[9] Xinkun Nie and Stefan Wager. Quasi-oracle estimation of heterogeneous treatment effects. arXiv preprint arXiv:1712.04912, 2017.
[10] Miruna Oprescu, Vasilis Syrgkanis, and Zhiwei Steven Wu. Orthogonal random forest for heterogeneous treatment effect estimation. CoRR, 2018. URL: http://arxiv.org/abs/1806.03467, arXiv:1806.03467.
[11] Piotr Rzepakowski and Szymon Jaroszewicz. Decision trees for uplift modeling with single and multiple treatments. Knowl. Inf. Syst., 32(2):303–327, August 2012.
[12] Yan Zhao, Xiao Fang, and David Simchi-Levi. Uplift modeling with multiple treatments and general response types. In Proceedings of the 2017 SIAM International Conference on Data Mining, 588–596. SIAM, 2017. https://arxiv.org/abs/1705.08492
[13] Hahn, P. Richard, Jared S. Murray, and Carlos M. Carvalho. "Bayesian Regression Tree Models for Causal Inference: Regularization." Confounding, and Heterogeneous Effects 1706 (2017).
[14] Chen, Huigang, Totte Harinen, Jeong-Yoon Lee, Mike Yung, and Zhenyu Zhao. "Causalml: Python package for causal machine learning." arXiv preprint arXiv:2002.11631 (2020). https://arxiv.org/abs/2002.11631
[15] Zhao, Zhenyu, Yumin Zhang, Totte Harinen, and Mike Yung. "Feature Selection Methods for Uplift Modeling." arXiv preprint arXiv:2005.03447 (2020).
[16] Zhao, Zhenyu, and Totte Harinen. "Uplift modeling for multiple treatments with cost optimization." In 2019 IEEE International Conference on Data Science and Advanced Analytics (DSAA), pp. 422-431. IEEE, 2019.





直播信息




时间:

2022年1月16日上午9: 00-11: 00


参与方式:

  • 文末扫码参加读书会第三季,加入群聊,获取系列读书会回看权限,成为因果社区种子用户,与900余位社区的科研工作者沟通交流,共同推动因果科学的发展。
  • 集智俱乐部 B 站免费直播,扫码可预约。

扫码预约



因果科学读书会第三季启动


由智源社区、集智俱乐部联合举办的因果科学与Causal AI读书会第三季,将主要面向两类人群:如果你从事计算机相关方向研究,希望为不同领域引入新的计算方法,通过大数据、新算法得到新成果,可以通过读书会各个领域的核心因果问题介绍和论文推荐快速入手;如果你从事其他理工科或人文社科领域研究,也可以通过所属领域的因果研究综述介绍和研讨已有工作的示例代码,在自己的研究中快速开始尝试部署结合因果的算法。读书自2021年10月24日开始,每周日上午 9:00-11:00举办,持续时间预计 2-3 个月。

读书会大纲一览:

Donald Rubin:Essential Concepts of causal inference

「基础理论学习」
因果推断的潜在结果框架在实验性研究的应用
因果推断在观察性研究中的应用:DESIGN

因果推断在观察性研究中的应用(续):ANALYSIS

「案例研讨」
医学、药学、生物学中的研究案例
管理学、经济学、社会学及政治学中的研究案例
因果随机森林及其在工业界的应用
多级治疗与连续性暴露
因果推荐系统
因果在自然语言处理中的应用

因果与公平性和可解释性

「深入理论学习」

双稳健估计、处理极端倾向得分的方法
阴性对照试验
高维因果推断
结合随机化试验数据与观察性数据



点击“阅读原文”,报名直播

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/125941
 
172 次点击