原文信息 1. Athey, Susan. "The impact of machine learning on economics." The economics of artificial intelligence: An agenda. University of Chicago Press, 2018.2. 黄乃静,于明哲."机器学习对经济学研究的影响研究进展".经济学动态,2018(07):115-129. 自李世乭与alphago的围棋大战后,AI、机器学习等等的字眼便是雨后春笋般出现在互联网以及我们的生活之中。大概也是那个时候开始,一些学者已经开始探究机器学习与计量经济学的关联了。今日,与机器学习相关的经济学会议、论坛都有不少。大家都在关注机器学习,但许多人仍仅仅是听说过,并没有形成科普级别的了解,更不用说运用了。 在我国,与机器学习相关的研究不断出现,包括了对机器学习与经济学关系的探究,或者是利用机器学习方法进行经济学分析等。但其中往往存在“浅尝辄止”的问题:要么是将机器学习方法作为一种可有可无的加分项,要么是过分地注重机器学习方法而忽视了经济学意义。 例如,在近期发表的一篇论文之中,涉及到对文本类型的分类,作者对所有文本中的一部分进行人工标注(A类和B类)后进行机器学习方法的分类,而后利用训练好的机器学习模型对剩余的文本进行A、B类的分类,最终构成变量。这里就很明显地存在三个问题:其一,文章没有报告分类模型的预测精度(测试集中预测值与真实值的配对正确率),模型精度并不可知;其二,不同的训练参数可能会带来不同的预测结果,文章在写作时可能选取了“有代表性的”基准回归结果的训练模型,但文章中并没有对模型的训练参数进行说明或稳健性检验。其三,既然文本的分类可以人工赋值,则代表了人工数据赋值的可靠性,全部文本都进行人工赋值得到的变量数据或许更可靠。如果人工赋值的数据不可靠,机器学习得到的预测数据也难以信服。 由此可见,在某些研究之中,机器学习并没有实质的正向作用,甚至存在负作用。任由这样的趋势发展,经济学研究可能就变成了一种“调参游戏”,研究者利用机器学习得到了“有代表性”的回归结果,称之为“机器学习与计量经济学的完美结合”,这是万万不可取的。 事情总有其正反两面,虽然机器学习在当下经济学的应用并不成熟,但其潜力依然是很可观的。在下文,我将从数据获取、数据处理、数据分析这三个方面展望机器学习与计量经济学的未来。 机器学习在数据获取方面有很可观的作用:机器学习致力于得到精确度最高的预测模型,因而一些精度足够高的机器学习模型能够提供高质量的预测数据。同时,机器学习能够将高维度(dimension)的数据转化为低维度的数据,形成可信的指标。例如,在投资界中,部分机构利用股吧、微博的文本信息进行情感分析,得到一个可量化的情感得分,以此估计市场情绪。
(百度AI开放平台的情感分析示例) 在经济学界,一些学者也开始尝试利用机器学习来构建指标。除了上述例子之中的自然语言处理方面的运用,还有诸如机器视觉、应答等功能等待经济学者们去挖掘、应用。例如,我们可以对每一年某政策文件进行自然语言处理,得到关键词、词频、词向量、相似度、情绪等信息,从而为经济学的研究打开新的思路。 在数据处理方面,机器学习能够在一定程度上进行数据清洗与挖掘。例如,我们可以利用机器学习方法发现诸如人工输入导致的异常值等等。再者,我们或许可以通过机器学习聚类对数据进行一定的信息挖掘。 在数据分析方面,如今已经有不少的应用,其中较为普遍的是高维回归。但是,对于其他方面而言,机器学习方法在因果识别之中的应用仍然被许多学者所热议。固然,计量经济学追求纯净的因果关系,而机器学习追求高精度的预测,两者的发展方向并不一致,但不一定是没有交集的。在某些方面,机器学习对计量经济学之中的一些难题有较好的解决方法,如模型形式、大数据处理等,但其因果性往往不能说服当下的经济学者。机器学习在数据分析方面如何与计量经济学相融合,依然是有待解决的问题,也是未来的前进方向。同时,在进入大数据时代的今天,变量数、数据量爆炸,使得统计学意义上的显著似乎更加容易满足,大样本甚至是全样本带来的杂音也是我们不可忽视的,而机器学习也在一定程度上提供了解决方案。 我十分相信在不久的未来,机器学习与计量经济学的关系将得到更多的讨论,机器学习在计量经济学之中的应用也会越来越广泛而普遍,使得因果推断进入更高的层次。但在那之前,我们还得冷静地看待机器学习与计量经济学结合过程中出现的问题,切不可深化机器学习,更不能因为机器学习的优点放弃经济学理论与意义。 Abstract
Article 1 :This paper provides an assessment of the early contributions of machine learning to economics, as well as predictions about its future contributions. It begins by briefly overviewing some themes from the literature on machine learning, and then draws some contrasts with traditional approaches to estimating the impact of counterfactual policies in economics. Next, we review some of the initial “off-the-shelf” applications of machine learning to economics, including applications in analyzing text and images. We then describe new types of questions that have been posed surrounding the application of machine learning to policy problems, including “prediction policy problems,” as well as considerations of fairness and manipulability. We present some highlights from the emerging econometric literature combining machine learning and causal inference. Finally, we overview a set of broader predictions about the future impact of machine learning on economics, including its impacts on the nature of collaboration, funding, research tools, and research questions. Article 2 :机器学习与经济学研究的融合将改变传统经济学的研究方式。本文就机器学习对经济学研究的影响进行了较为系统的梳理,着重分析了机器学习在大数据背景下对丰富经济数据多样性的贡献,机器学习对经济预测准确性的改进作用,以及机器学习在估计平均处理效应、处理效应异质性和结构模型等因果推断中的应用,对这些领域的重要研究进行了比较详细的介绍。在阐述机器学习优势的同时,本文也指出在经济学研究中使用机器学习方法可能存在的局限性,并对未来的研究方向进行了展望。 声明推文仅代表文章原作者观点及推文作者的评论观点,并不代表香樟经济学术圈公众号平台观点。香樟经济学术圈征稿 香樟致力于提供学术研究公共品,对香樟最好的回馈就是向平台赐稿。联系邮箱cectuiwen@163.com 香樟经济学术圈本期小编:杨梦俊