社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

机器学习把因果推断玩出花!

AI academic space • 1 周前 • 143 次点击  


导言

在实证研究愈发追求精准因果识别的当下,高维数据爆发、非线性关联凸显、异质性处理效应复杂等现实挑战,让传统因果推断方法在建模灵活性、数据处理能力上的局限日益凸显。而机器学习的出现,为因果推断领域带来了突破性解决方案。如今,机器学习与因果推断的深度融合,已成为顶刊论文、政策评估、商业决策中突破研究瓶颈、提升结论可信度的核心路径。

我们特设计《机器学习因果推断前沿训练营》,内容是目前顶刊中的前沿方法,覆盖OLS因果推断逻辑以及DID、RDD、SCM等准自然实验逻辑,以及最新的聚束分析和群聚双重差分!同时介绍LASSO、随机森林、梯度提升树GBDT、神经网络等机器学习方法,并介绍机器学习合成控制法、倾向评分匹配、双重机器学习(Double ML)、因果树与因果森林异质性处理效应等前沿实。全程配套 Stata 实操教程、American Economic Review、《经济研究》等顶刊例文精读与真实案例复刻。
1. 课程概览

课程名称:机器学习与因果推断前沿--寒假班

课程时间:2026年3月7-8号、3月21-22日、3月28-29日 上午10:00-12:00,下午14:00-18:00,共六次课


授课形式:腾讯会议线上直播+课后回放+课程资料


报名方式:

扫码报名

 课程特色:

1、聚焦领域最新进展:深度拆解因果推断与机器学习交叉领域的前沿原理,同步顶刊研究范式与领域最新成果。

2、覆盖多场景验证:课程配套AER、RFS等15篇顶刊精读与真实案例分析,实现学术价值与应用价值的双重落地。

3、代码配套可复用性强:每类核心方法均配备全套可复用代码与对应数据,可直接适配自身研究或工作场景,大幅降低实操门槛。

2. 老师介绍


施一宁211大学副教授、博导,帝国理工大学金融学博士,发表Journal of Financial Markets、Journal of Banking & Finance、European Financial Management、International Review of Financial Analysis等ABS3论文4篇,主持国家自然科学基金1项, 主持并参与国家一流课程(金融类)建设,同时担任European Journal of Finance审稿人。

3. 课程大纲



                                                 

专题一因果推断基础与OLS因果推断

一、因果推断基础:潜在结果框架、因果图与随机化实验

1、顶刊因果推断模型方法及情况梳理

2、潜在结果框架:辛普森悖论、潜在结果、稳定性假设、ATT/ATU/ATE估计

3、条件期望函数与随机化实验:迭代期望函数;条件期望函数的基本性质;为什么要使用条件期望函数?完全随机化实验与分层随机化实验;独立性与条件独立性假设

二、OLS核心推断问题

1、模型有效设定:稳健标准误(聚类、Bootstrap);聚类层级选择;样本剔除标准

2、多元线性回归与FWL定理;固定效应模型;OLS与FE选择;联合固定效应与时间趋势项

3、遗漏变量偏误方向:低估还是高估

三、机制分析:调节、分组作用机制

1、调节效应专题:含交互项的调节模型(含变量中心化逻辑);如何将交互项表述转化为机制表述;单独项的解释问题

2、分组效应专题:分组的标准确定;组间系数差异检验

3、经济研究等最新机制检验方法:打破规矩,追求本质X→M

专题因果推断:准自然实验思路

一、双重差分法

1、标准DIDStata实操

2、三重差分模型(DDD)Stata实操

例文精读:[1] Mian, A., & Sufi, A. (2022). Credit supply and housing speculation. The Review of Financial Studies, 35(2), 680-719.

3、多时点DID拓展

1多拓展期DID政策效应动态图Beck_Levine(2010)经典图coefplot命令动态图

2多期DID平行趋势检验图形实现图示法系数检验法

3安慰剂检验的Stata实现政策实施时间前置处理组随机化处理

例文精度及复刻

[1]Favara, G., & Imbs, J. (2015). Credit supply and the price of housing. American Economic Review, 105(3), 958-92.

[2]曹清峰.国家级新区对区域经济增长的带动效应——基于70大中城市的经验证据.中国工业经济,2020(07)

DID模型变形

1、时变处理时间与持续期的灵活面板DID因果分析: 多时点DID问题/TWFE 在估计静态模型时的潜在问题Bacon系数分解定理负权重诊断法

2、异质性处理效应下的双向固定效应估计与模糊DID应用

1模糊DID(Fuzzy DID)估计量与Stata实现

2异质性处理效应时,双向固定效应估计还稳健吗?

3异质性处理效应存在时的解决方法:组别-时期平均处理插补估计量堆叠回归估计量异质性

例文精读:

[1]Chaisemartin, Clément de,and Xavier D’Haultfoeuille. “Two-Way Fixed Effects Estimators withHeterogeneous Treatment Effects.” American Economic Review 110, no. 9(September 2020):2964–96

3、空间DID

1)忽略空间因素的DID结果可靠吗?

2)空间DID模型构建 

例文精读:

Chagas, André L.S,Azzoni C R , Almeida A N . A spatial difference-in-differences analysis of theimpact of sugarcane production on respiratory diseases. Regional Science and Urban Economics, 2016.

4、群聚双重差分(Bunching-DID)

1)现实背景 基本原理:非线性政策激励引发行为聚束

2)忽略群聚结构的后果

3)群聚DID的识别与估计

4)AI赋能下的Stata实操(bunchbounds,模型构建、结果解读)

参考文献:

[1]蔡宏波,汤城建,毛健.减税激励与企业异质性创新[J].经济研究,2025,60(02):107-123.

[2]孟元,杨蓉.大数据时代的政府治理:数字政府与企业研发操纵[J].世界经济, 2024, 47(1): 118-149

三、匹配法

1)主要类型:精确匹配(Exact Matching)倾向匹配得分(PSM)的假设,匹配方法(最近邻匹配、卡尺匹配等)与优缺点

2PSM-DID与Stata实操:选择协变量和匹配方法、估计倾向得分、平衡性检验与共同支撑域估计

四、断点回归(RDD)

1精准断点回归设计(因果图视角、断点回归步骤)

2模糊断点回归设计

3内生分组与断点操纵

4弯折回归设计

5断点回归检验连续性检验、安慰剂检验

五、合成控制方法

1)合成控制法基本原理

2)非参数合成控制法

3SCM的稳健性检验

4合成控制双重差分法(SDID)及安慰剂检验

例文精读:

[1]Cerulli G. A flexible Synthetic Control Method for modeling policy evaluation[J]. Economics Letters, 2019.

六、工具变量法(IV)

1)识别条件:相关性(Wald估计、弱工具变量检验)与外生性的理论边界

2)工具来源与异质性:地理、制度、历史等外生变异来源;异质性工具(LATE框架)

3)主题工具变量:数字经济相关工具变量;环境经济相关工具变量;教育经济学相关工具变量;交通主题相关工具变量

4实战案例:数字经济相关工具变量的运用

参考文献:[1]曹希广,邓敏.电子商务政策与企业家创业精神[].世界经济,2024,(04):31-64

专题因果推断的机器学习基础

一、机器学习基本概念

1、什么是机器学习?监督学习 vs 无监督学习

2、回归(Regression)与分类(Classification)的区别

3、训练集、测试集、验证集

4、常用机器学习模型评价指标

5、回归分析评价指标:MAE、MSE、RMSE、R²等

6、分类模型评价指标:准确率、精确率、召回率、F1值等

二、常见回归模型介绍与实现

1、线性回归(LinearRegression)

1带正则化的回归:

2LASSO(L1 正则,自动特征选择)

3弹性网络(ElasticNet,L1+L2 混合)

2、树模型入门:

1决策树

2随机森林

3梯度提升树GBDT

3、深度学习基础实现

1神经网络基础

2卷积神经网络(CNN)

3 循环神经网络(RNN)

4、因果推断中的特征选择与降维
1机器学习优势:非线性建模、高维数据处理(对比传统方法)

案例复刻:正则化回归(LASSO/Ridge)

案例分析:[1]易志高,刘逸飞,潘镇.CEO特质与企业数字化转型——基于机器学习的变量选择[J].系统工程理论与实践,2025,45(05):1462-1484.

题四机器学习增强因果推断

一、机器学习合成控制法
1、理论讲解:反事实框架、合成控制法原理(Abadie et al.)

2、基于机器学习算法的合成控制评估案例讲解

数据预处理(匹配变量选择、时间窗口设定)参数敏感性分析安慰剂检验(随机分配处理组)

案例讲解:大小城市合并研究(郭峰,吕斌,熊云军,等.大小城市合并与行政边界地区经济增长

[1]基于机器学习算法的合成控制评估[J].数量经济技术经济研究,2024,41(09):26-48.

二、机器学习增强倾向评分匹配

1、理论讲解:逻辑回归GBDT神经网络等在倾向得分匹配中的应用

2、案例讲解

PSM相关模型的改进与应用

[1]谢申祥,范鹏飞,宛圆渊.传统PSM-DID模型的改进与应用[J].统计研究,2021(2):146-160)

三、双重机器学习(Double ML)

1、双重机器学习DML基本框架及优势(Chernozhukov et al., 2018)

1)核心思路:Neyman正交化与交叉拟合

2)高维数据下的变量选择与估计;非线性关系建模;缓解机器学习估计中存在的“正则偏误”

2、DID原理及其与DML的区别,何时用DID何时用DML?

3、双重机器学习Stata实现

[1]Ahrens, Achim, et al. "ddml: Double/debiased machine learning in Stata." The Stata Journal 24.1 (2024): 3-45.

4、双重机器学习的稳健性检验及Stata实现

[1]Pedro H.C. Sant’Anna, Jun Zhao,Doubly robust difference-in-differences estimators,Journal of Econometrics,Volume 219, Issue 1,2020,Pages 101-122,ISSN 0304-4076,

[ 2]Peng, Y., Shi, L., Shi, X., & Tan, S. (2024). Tone or term: Machine-learning text analysis, featured vocabulary extraction, and evidence from bond pricing in China. Journal of Empirical Finance, 78, 101534.

[3]Bianchi, D., Büchner, M., & Tamoni, A. (2021). Bond risk premiums with machine learning. The Review of Financial Studies, 34(2), 1046-1089.

四、因果树与因果森林
1、理论讲解:异质性处理效应(CATE)、广义随机森林(Athey 2019)

2、实操1:因果树构建解读树结构

[1]Li J, Ma S, Le T, et al. Causal decision trees[J]. IEEE Transactions on Knowledge and Data Engineering, 2016, 29(2): 257-271.

3、实操2:案例复现

1)广义随机森林

[1]Athey, Susan, Julie Tibshirani, and Stefan Wager. “Generalized random forests.” The Annals of Statistics 47.2.2019: 1148-1178;)

2异质性处理效应

[1]Stefan Wager & Susan Athey.2018 Estimation and Inference of Heterogeneous Treatment Effects using Random Forests, Journal of the American Statistical Association, 113:523, 1228-1242)

4. 课程报名


课程价格

拼团早鸟价:(开课前支付)999元;

原价:1699元

可按照实际支付金额开具电子发票


价格包含:直播课程+录播回放+课程资料+课程答疑(仅开课前支付能进答疑群)


如有下优惠,购买前找“学知老师”领取优惠券。


优惠一

普通用户转发本推文到朋友圈/皮皮侠数据会员,私聊学知老师 可获八折优惠券。
优惠二
尊享版超级课程会员可在直播结束后免费学习录播课程;如需直播+答疑+录播,超级课程会员可三折购买该课程;


扫码成为超级课程会员


4. 课程售后


课程发票/课程通知

联系“学知老师”可领取课程开课通知、结课证书、可报销发票等证明。








课程退款

在课程未开始前,接受“7天无理由退款”,由于是知识付费,一旦直播课开始后,不接受退款。退款请联系学知老师”。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/193300