前沿速递! DML, 因果森林, 深度学习, 金融机器学习等正如何深刻改变经济学？

凡是搞计量经济的，都关注这个号了

邮件：econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

接着“从Athey到Xiu: 盘点做机器学习与经济学交叉的10位顶级大牛”，我们看看机器学习到底是如何赋能或改造经济学研究的。

机器学习融入经济学的过程并非步调一致，而是针对经济学研究中的特定挑战，经济学者去不断调整和发展相应的机器学习技术。

下面几个关键的方法论前沿领域正在逐渐形成，机器学习增强了经济学研究的可能性。

1️⃣利用高维数据增强因果推断

从观测数据中推断因果关系是实证经济学面临的核心挑战之一，尤其是在需要控制大量潜在混淆因素（即高维控制变量）时，这一挑战更为严峻。在这种情况下，传统方法往往在模型选择或计算可行性方面捉襟见肘。

此外，若简单地使用机器学习算法估计干扰参数（例如，匹配或加权所需的倾向得分、回归调整所需的条件期望结果），再将这些估计值直接代入标准的因果推断公式，可能会导致结果产生严重偏差。

这种偏差的来源有二：一是许多机器学习方法内含的正则化倾向（会将估计值向零压缩），二是潜在的过拟合风险（模型对特定样本中的噪声拟合过度）。

为了应对这一难题，由 Chernozhukov、Chetverikov、Demirer、Duflo、Hansen、Newey 和 Robins 等学者着力发展的双重/去偏机器学习（double/debiased machine learning, DML）框架提供了一个强有力的解决方案。

参看1.前沿, 双重机器学习方法DML用于因果推断, 实现它的code是什么？2.使用双重机器学习DML方法进行因果推断和政策评估的案例, 数据和代码分享，3.双重机器学习DML用途, 步骤, 优势, 示例和代码等完整方法, 不信你还不懂, 附code，4.更精准地分析政策效果的“秘密武器”: 机器学习双重差分法(MLDID)

DML主要通过以下两大关键机制来解决偏差问题：

1.Neyman正交性（Neyman orthogonality）：DML 框架在估计目标因果参数（如平均处理效应 ATE）时，采用的特定估计方程（矩条件或得分函数）在数学构造上保证了其对干扰参数估计中的微小误差（在一阶上）不敏感。这意味着，即使机器学习对倾向得分或条件结果函数的估计存在瑕疵，其对最终因果参数估计值的影响也能被有效控制在最小程度。
2.交叉拟合（cross-fitting）：为了克服过拟合偏差，DML采用了一种系统性的样本分割策略。它将数据分成若干“折”（folds）。对每一折数据进行估计时，首先利用其余各折的数据来训练模型并估计干扰参数，然后利用这些在样本外（out-of-sample）得到的干扰参数估计值，在当前这一折上估计目标参数。最后，将所有折得到的目标参数估计值进行平均，从而有效消除了因使用同一批数据同时估计干扰参数和目标参数所引入的偏差。

通过结合Neyman正交性和交叉拟合，DML允许研究人员放心使用灵活、强大的机器学习算法（如随机森林、Lasso回归、神经网络、梯度提升树等）来捕捉干扰成分中复杂的函数关系，同时确保最终得到的目标因果参数估计量具有一致性、渐近正态性和近似无偏性。

参看1.决策树模型组合之随机森林与GBDT，2.前沿: 统计学习的随机森林算法详解, 通过示例, code和结果全方位解析！3.Lasso回归操作指南, 数据, 程序和解读都有，4.前沿: Lasso, 岭回归, 弹性网估计在软件中的实现流程和示例解读，5.如何用用LASSO方法挑选工具变量？6.lasso, lasso, lasso, 高维模型中进行因果推断利器，7.GPT前沿: 图神经网络GNN在经济金融领域中的研究应用进展！8.深度学习之BP神经网络--Stata和R同步实现（附数据和代码）

这使得研究者能够在高维数据场景下进行可靠的统计推断（例如构建置信区间、进行假设检验）。DML已被广泛应用于多种场景，包括估计部分线性模型、工具变量模型中的处理效应，以及在满足非混淆假设下或处理变量为连续型时的效应估计。

该方法降低了模型设定对特定函数形式的依赖，显著增强了实证结果的可信度。诸如DoubleML和EconML等专用软件包的开发也极大地方便了DML方法的实际应用。

2️⃣建模异质性处理效应

经济理论研究和政策实践常常不仅关心干预措施的平均效果，更需要深入理解其效果如何因个体的可观测特征而在不同个体或群体间存在差异（即效果的异质性）。

准确识别异质性处理效应（HTE）对于设计更具针对性的政策、评估政策的分配效应以及检验干预措施的作用机制至关重要。然而，传统方法（如包含大量交互项的回归分析或按预设规则划分的分组分析）在统计上面临挑战，可能会因为多重假设检验问题或依赖于任意的分组定义而导致错误的结论。

参看1.因果推断异质性什么鬼? 边际处理效应让你与众不同，2.异质性处理效应分析HTE是个啥, 谢宇院士与这篇文章的“八卦”，3.分位数处理效应模型, 异质性分析的基础，4.AER最新, 人什么时候死取决于你住在哪里, 基于双重差分, 异质性处理效应的发现！5.AER文的数据和代码可下载供复制结果! 双重差分法和异质性处理效应分析范文，6.干货: 继续解锁CATE,QTE,DTE,MECT,CMA等, 政策效应异质性一次讲透, 附上code和案例解.)

由Susan Athey和Stefan Wager等人重点发展的因果森林（causal forests）为此提供了一种基于数据驱动的非参数估计方法。因果森林是对经典随机森林算法的巧妙改造，其目标并非直接预测结果变量本身，而是专注于估计条件平均处理效应（CATE），即 τ(x)=E[Y(1)−Y(0)∣X=x]。

这里，Y(1) 和 Y(0) 分别代表个体在接受处理和未接受处理两种状态下的潜在结果，而 X=x 是个体的协变量特征。因果森林算法会构建大量的“因果树”，每棵树在分裂节点时，都依据协变量将数据分区，其目标是最大化不同叶节点（leaf nodes）之间处理效应的差异。

对于任何一个个体，其 CATE 的最终估计值是其落在所有树中相应叶节点上处理效应估计值的平均。这相当于利用整个森林为每个个体自适应地定义了一个“相似”群体的邻域。

因果森林的主要优势在于其能够自动发现驱动处理效应异质性的复杂交互模式和非线性关系，而无需研究者预先设定具体形式。更重要的是，该方法具备扎实的理论基础，研究者已经证明在特定条件下，CATE估计量是一致且渐近正态的，这为构建有效的置信区间提供了保障。

在具体实现中（例如 grf 软件包），通常会融入“诚实性”（honesty）原则（即用一部分数据构建树的结构，用另一部分数据估计叶节点上的效应，以避免过拟合），并结合估计的倾向得分来调整混淆因素，同时也能处理聚类标准误等复杂情况。

广义随机森林（GRF）是对因果森林思想的进一步推广，它允许使用基于森林的方法来估计更广泛的一类由局部矩方程定义的统计量，例如条件分位数效应，或利用工具变量估计的HTE。

因果森林已在众多经济学分支领域得到成功应用，涵盖劳动经济学（评估暑期工作项目、分析工资税归宿）、环境与能源经济学（评估节能“助推”政策效果）、公共财政、健康经济学、发展经济学以及公司金融等。相应的方法扩展也已使其能够应用于面板数据和双重差分分析框架。

在呈现结果时，通常的做法包括：展示估计出的 CATE 分布特征、利用变量重要性指标识别影响异质性的关键变量、绘制CATE估计值与重要协变量的关系图等。

3️⃣利用深度学习挖掘非结构化数据价值

经济活动和社会现象产生了海量的非结构化数据，如文本（新闻报道、社交媒体帖子、政府公文、历史档案、企业年报等）和图像（卫星遥感照片、扫描文档、街景图片等）。传统上，对这类数据进行定量分析一直颇具挑战性。

参看1.机器学习刚得诺奖, AEA迅速发了篇经济学家如何利用深度机器学习技术的综述！2.深度学习应用于时序预测研究综述，3.前沿: 深度学习在经济学中的全面应用, 一篇系统性的综述！4.最全: 深度学习在经济金融管理领域的应用现状汇总与前沿瞻望, 中青年学者不能不关注！5.深度学习 vs. 概率图模型 vs. 逻辑学

深度学习作为机器学习的一个分支，依托深度神经网络（DNNs）的强大能力，为从这些原始、非结构化的输入中提取有价值的结构化信息提供了有效工具。Melissa Dell 等学者的研究尤为突出地展示了深度学习方法在经济学研究中的巨大潜力。对于经济学者而言，值得关注的关键深度学习架构和技术包括：

分类器（classifiers）：用于将输入单元（如一篇文档、图像中的一个区域）归入预先定义的类别（如文档类型、主题标签、图片中是否包含特定物体等）。
回归模型（regression models）：用于根据非结构化输入预测连续型变量（如利用卫星夜间灯光数据预测区域 GDP）。
嵌入模型（embedding models）：如 word2vec、GloVe 或基于 Transformer 的模型，它们能将输入（词语、句子、图像等）表示为高维连续空间中的密集向量（embedding），向量间的距离可以捕捉语义或视觉上的相似性。这些嵌入向量可作为特征输入到后续的经济模型中。
生成式人工智能（generative AI）：如大型语言模型（LLMs）或生成对抗网络（GANs），能够生成新的文本或图像，可用于数据增强、模拟推演甚至辅助分类等任务。
序列到序列模型（sequence-to-sequence models）与 Transformer：这类架构特别擅长处理文本等序列数据，是实现机器翻译、文本摘要、高级光学字符识别（OCR）等任务的核心技术。

深度学习在经济学中的应用版图正以前所未有的速度扩张。具体实例包括：自动化处理历史文献或复杂版式文档的数字化与信息提取；利用语义理解技术改进含噪声数据集间的记录匹配与链接；通过分析卫星或街景图像来量化经济活动、土地利用变化或贫困状况；进行大规模文本分析，以实现主题挖掘、情感分析，或追踪新闻媒体、社交网络、官方文件中特定议题的关注度；以及分析中央银行新闻发布会等活动的音频或视频数据。

与此同时，像 EconDL 网站及其配套工具等资源的出现，也旨在降低社会科学家应用这些前沿方法的门槛。

4️⃣经济学与金融学中的预测应用

尽管目前许多研究聚焦于将机器学习技术整合到因果推断框架中，但机器学习在预测（prediction and forecasting）方面的固有优势，对于经济学和金融学的诸多应用场景而言，其价值依然不可或缺。在很多领域，生成高精度的预测或准确识别数据中的预测模式本身就具有极其重要的意义。

金融机器学习（financial machine learning）是当前尤为活跃的研究方向之一，Bryan Kelly 和修大成（Dacheng Xiu）等学者是该领域的代表性人物。他们将多种机器学习方法，如惩罚性回归（Lasso, Ridge）、基于树的方法（随机森林、提升树）以及各类神经网络（包括深度学习和自编码器），应用于实证资产定价的核心议题。

参看1.重塑: 机器学习中经济金融领域常用代码库和完整案例代码, All in机器学习. 2.耶鲁和芝大2023新书“金融机器学习”终于出来了！3.金融学中机器学习,大数据, 因果推断和Python操作书籍，4.前沿: 金融领域的人工智能和机器学习, 1986-2021前沿研究主题和集群进展！5.利用机器学习进行实证资产定价, 金融投资的前沿科学技术!，6.前沿: 机器学习在金融和能源经济领域的应用分类总结)

具体应用场景包括：度量时变的风险溢价、预测资产收益率、构建波动率和相关性模型、优化投资组合配置、以及从新闻文本等另类数据源中挖掘信息。该领域的研究成果普遍表明，相较于传统的线性模型，基于机器学习的预测模型在准确度上通常有显著提升，并能为投资者带来可观的经济价值。当然，挑战也同样存在，尤其是一些复杂模型的“黑箱”特性（难以解释其决策过程）和对模型可解释性的需求（这对于风险管理和向投资者沟通业绩归因至关重要）。

除了金融领域，机器学习预测方法还广泛应用于，解决所谓的“预测驱动的政策问题”（prediction policy problems），即预测结果本身就是制定政策的直接依据；通过修正调查对象的预期偏差来提升宏观经济预测的准确性；预测金融危机的发生概率；预测司法判决结果；以及预测劳动力市场的供需状况与个体就业结果等。

此外，学界也呈现出一个日益清晰的趋势：在构建大型经济模型时，有意识地将模型分解为预测部分和因果分析部分，并在合适的环节将预测任务委托给表现更优的机器学习算法来完成。

5️⃣辅助生成科学假设

机器学习在经济学中还有一项颇具新意的应用：不仅用于检验已有的理论假设，更能辅助研究者生成全新的、值得探索的假设。正如 Ludwig 和 Mullainathan 所倡导的，机器学习算法擅长在高维数据中捕捉人类研究者可能忽略的微妙模式和复杂关联。

关于Snedhil，参看1.25年美国经济学会杰出讲座: 印度裔MIT教授做的精彩演讲“算法时代的经济学”.，2. 如何设计双重差分法DID: 各种政策研究的最佳指南! 3.Top, 机器学习是一种应用的计量经济学方法, 不懂将来面临淘汰危险！4.前沿: 在大语言模型LLM下制定计量议题和实证框架这块, 美国这次又走在了学术界前面！5.TOP5: 由人类提出研究假说已out了! 还是交给机器学习和AI可靠

他们的研究工作演示了这样一个流程：首先，利用算法在一个大数据集中识别出具有预测能力的模式（例如，通过分析面部照片特征来预测法官是否会判处监禁）。然后，让人类被试与这个“黑箱”预测模型互动（观察其预测结果与输入特征的关系），启发他们提炼出关于背后驱动因素的可解释、新颖的假设（例如，可能是某种特定的面部特征或表情影响了法官的潜意识判断）。

这些由算法启发而来的新假设，随后便可以付诸严格的实证检验。这种“人机协作”的模式提供了一种系统化的方法，帮助研究者在探索海量复杂数据集（来源可能包括手机信令、卫星影像、网络行为日志、大规模文本库等）时，发现潜在的、未知的行为规律或经济机制，从而极大地丰富了科学研究中至关重要的、提出问题的“前科学”（pre-scientific）探索阶段。

Dell 等人专注于利用深度学习处理非结构化数据，Kelly 和 Xiu 等人聚焦于金融市场中的机器学习应用，Athey 和 Wager 等人致力于发展和完善因果森林方法，Chernozhukov 及其合作者则深耕于 DML 理论框架，而 Mullainathan 等人则在探索机器学习在行为经济学和假设生成中的独特作用。

关于机器学习，参看：1.机器学习之KNN分类算法介绍: Stata和R同步实现（附数据和代码），2.机器学习对经济学研究的影响研究进展综述，3.回顾与展望经济学研究中的机器学习，4.最新: 运用机器学习和合成控制法研究武汉封城对空气污染和健康的影响! 5.Top, 机器学习是一种应用的计量经济学方法, 不懂将来面临淘汰危险！6.Top前沿: 农业和应用经济学中的机器学习, 其与计量经济学的比较, 不读不懂你就out了！7.前沿: 机器学习在金融和能源经济领域的应用分类总结，8.机器学习方法出现在AER, JPE, QJE等顶刊上了！9.机器学习第一书, 数据挖掘, 推理和预测，10.从线性回归到机器学习, 一张图帮你文献综述，11.11种与机器学习相关的多元变量分析方法汇总，12.机器学习和大数据计量经济学, 你必须阅读一下这篇，13.机器学习与Econometrics的书籍推荐, 值得拥有的经典，14.机器学习在微观计量的应用最新趋势: 大数据和因果推断，15.R语言函数最全总结, 机器学习从这里出发，16.机器学习在微观计量的应用最新趋势: 回归模型，17.机器学习对计量经济学的影响, AEA年会独家报道，18.回归、分类与聚类：三大方向剖解机器学习算法的优缺点（附Python和R实现），19.关于机器学习的领悟与反思，
20.机器学习，可异于数理统计，21.前沿: 比特币, 多少罪恶假汝之手? 机器学习测算加密货币资助的非法活动金额! 22.利用机器学习进行实证资产定价, 金融投资的前沿科学技术! 23.全面比较和概述运用机器学习模型进行时间序列预测的方法优劣！24.用合成控制法, 机器学习和面板数据模型开展政策评估的论文！25.更精确的因果效应识别: 基于机器学习的视角，26.一本最新因果推断书籍, 包括了机器学习因果推断方法, 学习主流和前沿方法，27.如何用机器学习在中国股市赚钱呢? 顶刊文章告诉你方法！28.机器学习和经济学, 技术革命正在改变经济社会和学术研究，29.世界计量经济学院士新作“大数据和机器学习对计量建模与统计推断的挑战与机遇”，30.机器学习已经与政策评估方法, 例如事件研究法结合起来识别政策因果效应了！31.重磅! 汉森教授又修订了风靡世界的“计量经济学”教材, 为博士生们增加了DID, RDD, 机器学习等全新内容！32.几张有趣的图片, 各种类型的经济学, 机器学习, 科学论文像什么样子？33.机器学习已经用于微观数据调查和构建指标了, 比较前沿！34.两诺奖得主谈计量经济学发展进化, 机器学习的影响, 如何合作推动新想法！35. 前沿, 双重机器学习方法DML用于因果推断, 实现它的code是什么？

下面这些短链接文章属于合集，可以收藏起来阅读，不然以后都找不到了。

7年，计量经济圈近2000篇不重类计量文章，

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

计量经济圈组织了一个计量社群，有如下特征：热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此，建议积极进取和有强烈研习激情的中青年学者到社群交流探讨，始终坚信优秀是通过感染优秀而互相成就彼此的。