社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

2025--双重机器学习DDML操作规范(附论文复刻)

数量经济学 • 5 月前 • 216 次点击  

2025双重机器学习DDML操作规范(稳健性检验方法汇总)


一、稳健性检验方法汇总

基于文献中的常见实践,对目前中文期刊上DDML稳健性检验方法进行如下汇总

1. 数据层面的检验

数据层面主要进行变量替换与样本调整

  • 替换因变量/处理变量:如用专利引用次数替代研发投入衡量创新。

  • 样本调整:删除直辖市样本、剔除特定年份(如异常政策期)、缩尾处理(1%或5%)或异常值(1%缩尾处理)。

  • 数据分割:改变训练集与测试集比例,验证模型稳定性。

  • 替换因变量/核心解释变量(如更换指标定义)

2. 模型设定层面的检验/模型形式扩展

  • 加入控制变量二次项、交互项或非线性项

  • 控制变量扩展:加入二次项或交互项(如行业×年份固定效应)。

  • 算法替换:对比Lasso、随机森林、梯度提升树等不同机器学习方法的结果。

  • 工具变量稳健性:采用部分线性工具变量模型或更换工具变量。

3. 因果推断特定检验

结合双重差分法(DID)、平行趋势检验、安慰剂检验

  • 平行趋势检验:通过事件研究法验证DID假设。
  • 安慰剂检验:随机生成伪处理组或伪处理时间,验证估计效应是否消失。
  • 动态效应分析:分阶段估计政策效果的时变特征。


图片


BRUCE E. HANSEN在ECONOMETRICS一书的第29章机器学习中提到,Lasso回归机器学习中,最新推断方法贡献是Chernozhukov、Chetverikov、Demirer、Duflo、Hansen、Newey和Robins(2018)提出的双重/去偏机器学习(DML)估计。

这种估计方法近年来在计量经济学家中受到了相当大的关注,并被认为是最先进的估计方法。

机器学习(含双重机器学习DDML章节)--Hansen教授2021年3月更新的2本计量经济学教材 (qq.com)

下面我们通过一组数据来看看该方法在最新《中国工业经济》以及《数量经济技术经济研究》中的最新应用。

  • 1、2024年第12期《数量经济技术经济研究》中,论文标题为:贸易新业态对绿色技术创新的影响研究——来自跨境电商综合试验区政策的证据,使用到了双重机器学习

  • 2、网络首发于2024-09-27 12:04:08,2024年第12期《数量经济技术经济研究》论文,法律制度完善、跨区域合作与省际边界地区绿色发展--来自《旅游法》实施的准自然实验。也是使用到了双重机器学习

  • 3、《中国工业经济》上,银行监管处罚如何影响企业创新,一文也使用到了双重机器学习DDML论文

  • 4、《数量经济技术经济研究》2024年第8期,数据要素共享与城市创业活力——来自公共数据开放的经验证据,采用双重机器学习

  • 5、《数量经济技术经济研究》2023年第4期《数量经济技术经济研究》,双重机器学习论文,标题:网络基础设施、包容性绿色增长与地区差距——基于双重机器学习的因果推断

通过以上数据可以预见,2025年该方法应用数量将更多。

最新数据:


掌握双重机器学习必备资源、文章:

😀论文推荐:中文期刊上基于机器学习算法的合成控制法评估论文

🔺DDML:双重机器学习(Stata中Python相关设置) (qq.com)

😆2024Stata暑假班--精彩片段--机器学习与断点回归

😅2024Stata暑假班--精彩片段--机器学习与合成控制法

🌈2024Stata暑假班--精彩片段--双重机器学习DDML

👉《数量经济技术经济研究》双重机器学习论文复刻结果

🤣机器学习&因果推断--2024Stata暑假班--精彩片段 (qq.com)

🎈AER大运河论文讲解--2024Stata暑假班--精彩片段--异质性DID专题 (qq.com)

双重机器学习网站--DDML学习网站 (qq.com)

DDML:双重机器学习(Stata中Python相关设置) (qq.com)

《数量经济技术经济研究》双重机器学习论文复刻结果 (qq.com)

2024Stata暑假班--精彩片段--双重机器学习DDML (qq.com)

DDML--双重机器学习推荐阅读清单 (qq.com)

双重机器学习DDML专题--2024年第8期《数量经济技术经济研究》论文复刻 (qq.com)

2024年8月Stata暑期班回顾丨因果推断&机器学习应用&异质性DID前沿&双重机器学习专题回顾 (qq.com)

不可不知的双重机器学习中Stata-Python交互操作链接资源 (qq.com)

24年8月Stata暑假班因果推断&机器学习应用双重机器学习 (qq.com)

Stata:DDML双重机器学习--ddml操作手册 (qq.com)

机器学习(含双重机器学习DDML章节)--Hansen教授2021年3月更新的2本计量经济学教材 (qq.com)

双重机器学习--ddml操作案例 (qq.com)

Mac版本Stata18:双重机器学习DDML论文复刻 (qq.com)

直播回顾--机器学习基本原理、机器学习与双重差分、断点回归应用等 (qq.com)


论文1:贸易新业态对绿色技术创新的影响研究——来自跨境电商综合试验区政策的证据

来源:2024年第12期《数量经济技术经济研究》

2024年《数量经济技术经济研究》全年目录

原文双重机器学习内容


代码示例:




Mac与Windows版--双重机器学习DDML论文复刻+资源汇总
更多内容详见原文代码

论文2:法律制度完善、跨区域合作与省际边界地区绿色发展--来自《旅游法》实施的准自然实验

网络首发时间:2024-09-27 12:04:08

来源:2024年第12期《数量经济技术经济研究》

【重磅】9月27日12:04出炉的《数量经济技术经济研究》上第3篇双重机器学习DDML论文

简介

借助《旅游法》实施的准自然实验,研究跨区域旅游资源合作开发制度完善对省际边界地区绿色发展的影响。

模型

利用《旅游法》实施的准自然实验构建双重差分模型,计量模型设定如下:

其中:

  • 下标i和t分别代表县域和年份
  • 核心被解释变量是表征县域i在第t年经济发展或污染程度的变量
  • 核心解释变量为Tourism_law*Border
  • Tourism_law和 Border表示政策冲击变量和处理变量。
  • Controls表示县域层面的一系列特征变量
  • 还控制了县域固定效应County和年份固定效应Year。

基准回归

稳健性检验

利用平行趋势检验、双重机器学习、安慰剂检验、替换被解释变量、缩小样本区间、高维固定效应、排除替代性假设等方法进行稳健性检验

平行趋势检验相关文章推荐:

双重机器学习检验

采用双重机器学习进行重新估计。

在控制年份固定效应和县域固定效应的基础上,逐步加入控制变量一次项、控制变量二次项和控制变量三次项,

双重机器学习网站--DDML学习网站 (qq.com)

DDML:双重机器学习(Stata中Python相关设置) (qq.com)

《数量经济技术经济研究》双重机器学习论文复刻结果 (qq.com)

2024Stata暑假班--精彩片段--双重机器学习DDML (qq.com)

DDML--双重机器学习推荐阅读清单 (qq.com)

双重机器学习DDML专题--2024年第8期《数量经济技术经济研究》论文复刻 (qq.com)

2024年8月Stata暑期班回顾丨因果推断&机器学习应用&异质性DID前沿&双重机器学习专题回顾 (qq.com)

不可不知的双重机器学习中Stata-Python交互操作链接资源 (qq.com)

24年8月Stata暑假班因果推断&机器学习应用双重机器学习 (qq.com)

Stata:DDML双重机器学习--ddml操作手册 (qq.com)

机器学习(含双重机器学习DDML章节)--Hansen教授2021年3月更新的2本计量经济学教材 (qq.com)

双重机器学习--ddml操作案例 (qq.com)

Mac版本Stata18:双重机器学习DDML论文复刻 (qq.com)

直播回顾--机器学习基本原理、机器学习与双重差分、断点回归应用等 (qq.com)

安慰剂检验

其他稳健性检验方法

  • 替换被解释变量

  • 缩小样本区间

  • 控制高维固定效应

  • 排除替代性假设


推荐3篇《中国工业经济》+《数量经济技术经济研究--双重机器学习DDML论文


3、《中国工业经济》上最新--双重机器学习DDML论文

来源:《中国工业经济》

题目:银行监管处罚如何影响企业创新


基准回归

  • reghdfe

  • ivreghdfe

内生性处理

  • 倾向得分匹配(PSM)。

  • (2)因果森林(RF)

  • (3)双重机器学习(DML)

稳健性检验

  • (1)更换估计方法。

  • (2)更换被解释变量。

  • (3)企业创新的滞后性。

  • (4)剔除直辖市样本。

  • (5)Heckman两步法。


论文复刻

4、文章题目:数据要素共享与城市创业活力——来自公共数据开放的经验证据

来源:《数量经济技术经济研究》2024年第8期

基准回归

  • reghdfe

平行趋势检验

  • reghdfe
  • coefplot

工具变量

  • ivreghdfe

Bacon分解

  • bacondecomp

De Chaisemartin和D' Haultfoeuille(2020)分解结果

  • twowayfeweights

Borusyak等(2021)估计量的事件研究图

  • did_imputation

Cengiz等(2021)估计量的事件研究图

  • stackedev

双重机器学习

  • ddml

论文复刻


5、《数量经济技术经济研究》双重机器学习论文复刻结果

文章标题:网络基础设施、包容性绿色增长与地区差距——基于双重机器学习的因果推断


表1--第3列结果


1--第4列结果


1--第7列结果

双重机器学习论文复刻--《数量经济技术经济研究》2023年第4期

推荐2篇《数量经济技术经济研究》--双重机器学习DDML论文

《数量经济技术经济研究》双重机器学习论文复刻结果

2024Stata暑假班--精彩片段--双重机器学习DDML (qq.com)

2024年8月Stata暑期班回顾丨因果推断&机器学习应用&异质性DID前沿&双重机器学习专题回顾 (qq.com)

24年8月Stata暑假班因果推断&机器学习应用双重机器学习 (qq.com)


图片


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/191207