第一天:软件基础与核心方法
上午:软件入门与双重机器学习基础
1. **Python
与Stata因果推断分析入门** - Python科学计算环境配置 - 关键Python库介绍(参考:Microsoft Research, 2023, EconML文档) - Stata基础因果分析命令回顾(参考:StataCorp, 2023, dml命令手册) - 两种软件的数据交互方法
- 实操练习:用两种软件运行相同的OLS回归
2. **双重机器学习介绍** - 传统计量方法的局限(参考:Angrist & Pischke, 2009) - 机器学习在因果推断中的潜力(参考:Hastie et al., 2017)
- 双重机器学习基本框架(参考:Chernozhukov et al., 2018) - Neyman正交性与去偏机制 - Python与Stata实现对比
3. **双重机器学习的软件实现框架** - Python实现:
EconML和DoubleML库(参考:Bach et al., 2022) - Stata实现:dml命令与插件 - 数据预处理最佳实践 - 交互演示:两种软件实现同一DML模型
下午:方法比较与代码复现
1. **基于机器学习的因果推断方法比较** - 双重机器学习vs传统方法(参考:Knaus et al., 2021) - 不同机器学习方法比较 - Python vs Stata实现效率对比
- 可视化与结果报告
2. **代码复现(1):跨软件实现** - Python复现:EconML实现基础DML(参考:Chernozhukov et al., 2018代码库) - Stata复现:
dml命令实现相同分析 - 结果对比与诊断 - 交互练习:软件选择实践
第二天:案例研究与高级应用
第二天:案例研究与高级应用(新增中文案例) 上午:案例研究
I - 政策与企业行为 1.跨境电商综合试验区政策对绿色技术创新的影响 o研究问题与数据介绍(参考:蒋金荷 & 黄珊, 2024) o双重机器学习实现步骤 o结果分析与政策启示
oPython与Stata实现对比 2.银行监管处罚对企业创新的影响 o研究设计回顾(参考:魏建等, 2024) o异质性处理效应分析 o
稳健性检验与机制讨论
下午:案例研究II - 区域发展与数据要素 1.公共数据开放对城市创业活力的影响 o研究问题与数据介绍(参考:蔡运坤等, 2024) o
双重机器学习应用 o结果可视化与政策建议 2.网络基础设施对包容性绿色增长的影响 o复现分析(参考:张涛 & 李均超, 2023) o因果效应估计与地区差距讨论
o双重机器学习的优势总结 3.综合实践与未来方向 o完整分析流程演练 o分组讨论:中文案例的扩展应用 o开放问题与最新研究进展
部分参考文献【中文顶刊】:
[11]蒋金荷,黄珊.贸易新业态对绿色技术创新的影响研究——来自跨境电商综合试验区政策的证据[J].数量经济技术经济研究,2024,41(12):133-154 [12]张科,熊子怡
.法律制度完善、跨区域合作与省际边界地区绿色发展——来自《旅游法》实施的准自然实验[J].数量经济技术经济研究,2024,41(12):47-67 [13]魏建,薛启航,王慧敏,姚笛.银行监管处罚如何影响企业创新[J].中国工业经济,2024(7):105-123 [14]蔡运坤
,周京奎,袁旺平.数据要素共享与城市创业活力——来自公共数据开放的经验证据[J].数量经济技术经济研究,2024,41(8):5-25 [15]张涛,李均超.网络基础设施、包容性绿色增长与地区差距——基于双重机器学习的因果推断[J].数量经济技术经济研究,2023,40(4):113-135
|