机器学习如何用？金融+能源经济学文献综述

👇 连享会 · 推文导航 | www.lianxh.cn

🍎 Stata：Stata基础 | Stata绘图 | Stata程序 | Stata新命令
📘 论文：数据处理 | 结果输出 | 论文写作 | 数据分享
💹 计量：回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归
⛳ 专题：SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析
🔃 因果：DID | RDD | 因果推断 | 合成控制法 | PSM-Matching
🔨 工具：工具软件 | Markdown | Python-R-Stata
🎧 课程：公开课-直播 | 计量专题 | 关于连享会

连享会课程 · 基于机器学习的因果推断方法

作者：全禹澄 (复旦大学)
邮箱：eli-quan@outlook.com

编者按：本文主要摘译自下文，特此致谢！
Source：Ghoddusi H, Creamer G G, Rafizadeh N. Machine learning in energy economics and finance: A review[J]. Energy Economics, 2019, 81: 709-727. -PDF-

温馨提示： 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码，直达原文：

1. 引言
2. 研究方法
3. 统计摘要
4. 详细综述：应用领域

4.1. 预测能源价格
4.2. 预测/建模能源消耗/需求
4.3. 其他应用

5. 批判性评价

5.1. ML 技术的成就和优势
5.2. 限制和挑战

6. 未来方向的建议

6.1. 当前文献的改进
6.2. 应用未充分利用的方法的机会
6.3. 未探索的领域
6.4. ML/AI的经济和组织影响

7. 结论
8. 相关推文

机器学习 (Machine Learning, ML) 正在为能源经济学和金融领域的研究创造新机遇。我们对 ML 在这两个领域的新兴文献做了批判性的综述。该综述总结了 2005-2018 年间发表的 130 多篇文章的方法和结果，这些文章主要针对的是 ML 在能源价格预测、需求预测、风险管理、交易策略、数据处理和宏观/能源趋势研判等领域的应用。我们的分析表明，支持向量机 (upport Vector Machine, SVM)、人工神经网络 (Artificial Neural Network, ANN) 和遗传算法 (Genetic Algorithms, GAs) 是能源经济学论文中最常用的技术。在对现有文献分析的基础上，我们讨论了当前研究中的空白，并对未来的研究提供了一些建议。

1. 引言

ML 指的是一类数据科学模型，这些模型可以从数据中学习以提高自己的性能。ML 的起源可以追溯到 20 世纪 50 年代和 60 年代科学界对通过计算机程序复制人类学习过程的兴趣。从这个角度来看，ML 从数据中提取知识，然后用于预测和生成新的信息，这些信息减少了未来的不确定性，并提供了解决问题的思路。在解析解无法明确提供指导的任务中，ML 特别有用，这类任务包括图像和语音处理、模式识别、或复杂的分类任务。

ML模型在处理、分类和预测复杂大规模数据方面的卓越性能使其在能源行业的许多领域广受欢迎。能源行业的应用示例包括油气田勘探 (Anifowose 等，2017)、油气过程 (Zendehboudi 等，2018)，油井诊断 (Fulford 等，2016)、太阳辐射预测 (Voyant 等，2017)、反应堆优化 (Zeng 等，2018)、风电预测 (Heinermann 和 Kramer，2016)、风能系统 (Marugán 等，2018)、故障预测 (Gupta 等，2015)、电力负荷预测 (Jurado 等，2015)、以及能源与水的关系 (Zaidi 等，2018)。

ML 也被广泛应用于能源市场的经济和金融分析，如价格预测和风险管理。比较 ML 与传统计量经济模型 (如 ARIMA 或 GARCH) 的一些特征，可以揭示 ML 在能源经济学中日益流行的一些原因。与经典统计/计量经济学方法相比，ML 方法的优点是能够管理大量的结构化和非结构化数据，并能快速做出决策或预测。ML 方法的重点是在给定其他变量的情况下，对某些结果变量做出准确的预测，因此 ML 模型没有对方程的函数形式、变量之间的相互作用和参数的统计分布作出任何先验的假设，这使得大规模数据处理和快速预测成为可能。

尽管 ML 在能源经济学中得到了广泛的应用，但据我们所知，还没有一篇综述论文系统地回顾了现有的文献。本文旨在回顾最近发表在各种能源相关和经济相关期刊上的文章。我们的综述集中在四个主要问题上：

哪些方法在能源经济学中经常使用，哪些方法没有得到充分利用，原因是什么？
能源经济和金融领域的热门和未被开发的应用领域分别在哪里？
能源经济/金融可以从其他领域学到什么？
这些领域未来的研究机会是什么？

我们的回顾表明，原油和电力价格预测是迄今为止能源经济/金融领域最流行的应用。就方法而言，人工神经网络是一种传统上广泛使用的技术，近期人们对支持向量机的兴趣不断增长。我们注意到，与其他科学领域相比，深度学习在这一领域并不常见。因此，在将 DL 应用于能源经济和能源金融问题方面存在更广泛的机会。

我们并不是第一个写一篇关于 ML 在能源领域应用的综述性论文。在相关或邻近的科学领域中有一些调查。例如，Voyant 等 (2017) 调查了用于预测太阳辐射的 ML 方法，Perera 等 (2014) 讨论了 ML 在可再生能源整合中的应用，Zemene 和 Khedkar (2017) 比较了用于确定客户电力消耗的 ML 算法。我们的重点主要是能源经济学和能源金融应用，因此，我们没有对能源工程应用中的 ML/AI 进行深入分析。尽管 Weron (2014) 没有特别关注 ML 技术，但他对用于电价预测的方法进行了综述。因此，可以将其视为对我们综述的补充。Debnath 和 Mourshed (2018) 回顾了用于能源规划模型 (Energy Planning Models, EPM) 的预测模型，并报告了人工神经网络 (ANN) 作为最流行的预测方法。Mullainathan 和 Spiess(2017)、Athey (2017) 提供了 ML 的非技术概述和经济/计量经济应用的回顾。经济学界主要关注 ML 在理论检验和因果推断方面的优势和局限，而能源界对这方面的关注较少，对应用主题更感兴趣。

本文的结构如下：第二节介绍了本研究所采用的研究方法；第三节报告了统计结果；第四节详细介绍了 ML 在特定领域的应用；第五节批判性地回顾了现有文献；第六节提出了建议和对未来的展望；最后，在附录 A 中快速概述了主要的 ML 技术和概念。

2. 研究方法

本文的重点是 ML 在能源经济/金融领域的应用。能源经济/金融和能源工程之间的界限既不严格也不明确。虽然有些主题属于一个领域 (例如，反应堆优化是一个明确的工程主题，期货交易策略是一个明确的经济学主题)，但不同子领域之间存在灰色区域 (例如，电力负荷和价格预测)。我们广义地定义能源经济学/金融应用为所有涉及价格、投资、企业和消费者的最佳行为，以及公共政策等任何形式的市场相关变量议题的研究。

我们使用多种策略来识别现有文献。我们首先确定可能包含使用 ML 技术来解决能源问题论文的期刊。这些期刊选自 SCImago 期刊排名 (SJR)、科学引文索引扩展 (SCIE)、社会科学引文索引 (SSCI) 和艺术与人文引文索引 (A&HCI) 等列出的主要能源相关和经济相关期刊。

我们有丰富的关键词和期刊，以及高被引论文的引文，希望我们对文献的全面搜寻能够带来比较公正的看法。三种专门的电气工程期刊 (IEEE Transactions on Power Systems, Electric Power Systems Research, and International Journal of Electrical Power & Energy Systems) 包含了大量关于能源经济学和能源系统工程的论文。但我们不将其包括在综述中，因为其他针对电力市场预测的调查 (Weron，2014) 对这些类型的论文提供了更深入更专业的介绍。我们的搜索可能会忽略一些发表在经济学主流以外的期刊上的论文 (例如，当地经济学或计算机科学期刊或技术会议论文集)。因此我们报告的数字可能低于标准文献计量来源 (如科学网或 Scopus) 的数字。这对我们来说是一个小问题，因为我们的目标是对大多数相关论文 (发表在高影响力期刊上) 的内容和方法进行深入综述，而不仅仅是提供统计分析。我们的综述也可能遗漏一些非公开的内容，这些内容涉及能源行业中 ML 应用的进展 (例如，用于贸易或风险管理目的的专有算法和技术)，因此报告的结果可能低估了该领域的前沿知识水平。

3. 统计摘要

首先报告我们发现的高水平统计摘要。其中，下表列出了映射到不同应用领域的论文列表，此表还总结了该特定领域中使用的所有技术。从下图中可以看到，价格预测是应用程序的最大类别。

Applications	List of papers	List of methods
Predicting energy prices	Conejo et al. (2005), Moshiri and Foroutan (2006), Shambora and Rossiter (2007), Yu et al. (2008), Ghaffari and Zare (2009), Koutroumanidis et al. (2009), Nguyen and Nabney (2010), Lin et al. (2010), Movagharnejad et al. (2011), Jammazi and Aloui (2012), Khosravi et al. (2013), Godarzi et al. (2014), Tang et al. (2015a), Young et al. (2014), Yu et al. (2014), Papadimitriou et al. (2014), Chiroma et al. (2015), Zhang et al. (2015), Yu et al. (2015), He et al. (2015), Ghasemi et al. (2016), Zhu et al. (2016), Yu et al. (2016a), Keles et al. (2016), Dudek (2016), Panapakidis and Dagoumas (2016), Wang and Wang (2016), Yu et al. (2016b), Baruník and Malinska (2016), Yu et al. (2017a), Dagoumas et al. (2017), Mirakyan et al. (2017), Zhu et al. (2017), Wang et al. (2017), Čeperić et al. (2017), Han et al. (2017), Singh et al. (2017), Zhao et al. (2017), Yang et al. (2017), Yu et al. (2017b), Safari and Davallou (2018), Zhu et al. (2018), Cheng et al. (2018a), Cheng et al. (2018b), Marcjasz et al. (2018), Lago et al. (2018a), Chai et al. (2018), Lago et al. (2018b), Huang and Wang (2018), Tang et al. (2018b), Tang et al. (2018a), Peng et al. (2018), Zhao et al. (2018), Wang et al. (2018e), Wang et al. (2018f), Bekiroglu et al. (2018), Bento et al. (2018), Dogah and Premaratne (2018), Ding (2018), Sun et al. (2018)	ANN, EMD-NNEL,SC, ARIMA–ANN, RBFN, AAL, AI, SVM, LSSVM–PSO, CEEMD-EELM, DEL, BED, NLSSVM, FFNN, BPNN, DL, KEL, NARNN, GA, GA-LSSVM, VEC-NARNN, NARX, EEMD-RVFL, PPM-KM, LSTM-DE, SR-FNN, VTFM, DFN, AIC-ANN, IDE
Predicting/modeling energy consumption/demand	Pao (2006), Murat and Ceylan (2006), Azadeh and Tarverdian (2007), Sözen et al. (2007), Sözen and Arcaklioglu (2007), Hamzaçebi (2007), Lai et al. (2008), Azadeh et al. (2008), Ünler (2008), Wang et al. (2009), Geem and Roper (2009), Azadeh et al. (2010), Ekonomou (2010), Kavaklioglu (2011), Kankal et al. (2011), Adam et al. (2011), Limanond et al. (2011), Geem (2011), Wang et al. (2011), Tang et al. (2012), Forouzanfar et al. (2012), Yu et al. (2012), Kialashaki and Reisel (2013), An et al. (2013), Liu et al. (2014), Ardakani and Ardehali (2014), Tang et al. (2014), Szoplik (2015), Antanasijević et al. (2015), Tang et al. (2015b), Castelli et al. (2015), Coelho et al. (2016), Ghasemi et al. (2016), Günay (2016), Kaboli et al. (2016), Liu et al. (2016), Panapakidis and Dagoumas (2017), Kaboli et al. (2017), Bassamzadeh and Ghanem (2017), Zeng et al. (2017), Özmen et al. (2018), Li et al. (2018a), Xiao et al. (2018), Chen et al. (2018), Wang et al. (2018d), Alobaidi et al. (2018), Hong et al. (2018), Wang et al. (2018g), Mohan et al. (2018), Li et al. (2018b)	ANN, GA, SNN, SI, SVR, ϵ-SVR, ANFIS, FFNN, EEMD, LSSVR, FA-LSSVR, SD-LSSVR, PSO–GA, IPSO-ANN, BPNN, RBFNN, EL, FFDN, WNN, DMD, GRNN, SSVRE
Model calibration	Amjady and Keynia (2010), Sun et al. (2011), Genc (2017)	MLPNN, NN, SVM
Trading strategies	Moreno (2009), Wang et al. (2016), Pinto et al. (2016)	AI, GA, SVM
Structure of energy systems	Ermis et al. (2007), Sözen (2009), Fang et al. (2013), Wang and Tian (2015), Ju et al. (2016a), Zhang et al. (2016), Ju et al. (2016b), Skiba et al. (2017), Farajzadeh and Nematollahi (2018)	WNN, One-Class SVM, AI, ANN
Policy analysis	Azadeh et al. (2007), Cinar et al. (2010), Mahmoud and Alajmi (2010), Granell et al. (2014), Dagoumas et al. (2017), Skiba et al. (2017), Mashhadi and Behdad (2018), Wang et al. (2018a)	NN, GA, SVM, ANN, LASSO, EEMD-LSSVM-ARIMA
Data management	Li et al. (2017), Zhang et al. (2018)	AL, SVM, AdaBoost

4. 详细综述：应用领域

现有的 ML方法在能源经济学相关论文中的应用可分为两大类：(1) 预测能源商品价格；(2) 预测/建模能源消费/需求。然而，许多论文在一个特定的能源经济学情景中使用 ML 方法。大多数论文主要采用个别 ML 技术或混合 ML/统计计量经济学技术。

4.1. 预测能源价格

能源商品价格序列通常表现出复杂的特征，如非线性、滞后项依赖性、非平稳性和波动聚集性，这使得简单的传统模型效果不佳 (Cheng 等，2018)。ML 方法可以提供更好的预测性能，因为它们在处理复杂的内部动态时具有更高的灵活性。绝大多数侧重于价格预测的论文要么考虑原油价格预测，要么考虑电力价格预测，预测天然气价格的论文要少得多。在煤炭作为主要能源的情况下，我们还没有发现任何主要的论文使用 ML 技术预测煤炭价格。

4.1.1. 原油价格预测

有关原油价格预测的论文主要基于人工神经网络的高级和混合版本，支持向量机模型的使用较少。此外，近年来，集成方法已变得越来越普遍。作为早期的成功案例之一，Moshiri 和 Foroutan (2006) 利用非线性 ANN 模型预测了原油期货价格的日度序列，其预测效果优于传统的计量经济模型。从那时起，基本模式已扩展到多个方向。

作为最早使用不同ML模型集成的尝试之一，Yu 等 (2008) 使用了基于经验模式分解 (Empirical Mode Decomposition, EMD) 的神经网络集成学习 (NNEL) 范式，Ding (2018) 扩展了这种方法，加入了预测油价的最终集成步骤。Jammazi 和 Aloui (2012) 开发了一种结合 Harr A Trous 小波分解 (HTW-MBPNN) 的多层 BP 神经网络，以改进原油价格预测。Yu 等 (2017) 提出了一种集成预测方法，将稀疏表示 (Sparse Representation, SR) 和前馈神经网络 (Feedforward Neural Network, FNN) 相结合来预测原油价格。结果表明，该方法优于其它流行的预测模型和其它分解工具的相似集合模型。

将 ML 和计量经济模型结合起来也是一种常见的方法。例如，Godarzi 等 (2014) 开发了一个带有外部输入的动态非线性自回归模型 (Nonlinear Autoregressive model with Exogenous inputs, NARX)。Zhang 等 (2015) 应用集成经验模态分解 (Ensemble Empirical Mode Decomposition, EEMD) 方法，将国际原油价格分解为一系列独立的内在模态函数 (Intrinsic Mode Functions, IMF) 和残差项。他们还将最小二乘支持向量机与粒子群优化 (Least Square SVM together with the PSO, LSSVM-PSO) 方法和广义自回归条件异方差 (GARCH) 模型相结合，分别用于预测原油价格的非线性和时变分量。

早期的模型通常使用自回归结构，而最近的论文则使用混合方法，可以管理大量的输入变量，如需求、供给、股票水平和金融市场指标 (Chai 等，2018)。Dogah 和 Premartane (2018) 研究了金砖四国 (巴西、俄罗斯、印度、中国和南非) 市场中石油风险因素变化对部门股票回报的影响。他们将 VAR 模型与随机森林技术相结合，提供了一个框架，克服了VAR模型的一些缺点，有助于选择所考虑的石油风险因素。Yu 等 (2014) 通过整合基于压缩感知的去噪 (Compressed Sensing-based Denoising, CSD) 和人工智能方法 (AI) ，提出了一种基于压缩感知的学习范式CSD-AI。结果表明，CSD-AI学习范式明显优于其他模型，包括没有CSD过程的单一模型和具有其他去噪技术的混合模型。Wang和Wang (2016) 提出了一种结合多层感知器和Elman递归神经网络 (ERNNs) 的神经网络架构 (一种时变预测控制系统) 以及随机时效函数。他们开发的ERNN具有记忆最近发生的事件以预测未来价格的能力。

DL模型作为人工神经网络的高级版本，在原油价格预测中还没有得到广泛的应用。一个例外是Zhao 等 (2017年) 使用DL算法进行原油预测。该文将叠加去噪自动编码器 (SDAE) 与bootstrap聚合 (bagging) 相结合。bagging例程生成多个数据集，用于训练一组基本模型 (DAE)

几乎所有最近在这个领域的论文都结合了多种先进技术。例如，Tang 等 (2015) 提出了一种耦合互补集成经验模式分解 (CEEMD) 和扩展极端学习机 (EELM) 的集成学习范式，以提高原油价格的预测精度。结果表明，对于波动性大、不规则性强的复杂时间序列数据，该模型是一种很有前途的预测工具。Zhu 等 (2016) 开发了一种自适应多尺度集成学习 (AMEL) 范式，将EEMD、PSO和最小二乘支持向量机 (LSSVM) 与核函数原型结合起来。Cheng 等 (2018) 使用对数周期幂律和多种群遗传算法预测油价转折点。Safari和Davallou (2018) 将指数平滑模型 (ESM)、ARIMA和NARNN结合在状态空间模型框架中。Cheng 等 (2018) 提出了一种混合向量误差修正和NARNN (VEC-NARNN) 模型来预测未来原油价格。结果表明，在多步超前短期预测中，VEC-NARNN模型比传统的GARCH类模型、VAR、VEC和NARNN模型具有更好的预测精度。Yu 等 (2016) 提出了一种混合学习范式用于原油价格预测，这一范式将 SVR 与混合优化搜索方法相结合，搜索方法用于 LSSVR 模型中的参数选择，由网格法和遗传算法组成。实证表明，基于混合网格遗传算法的 LSSVR 学习模型在预测精度和时间节省方面均优于其基准模型，包括一些流行的预测技术和与其他参数搜索算法相似的LSSVR。Huang 和 Wang (2018) 将 WNN 与随机时效函数相结合。最后，Zhao 等 (2018) 将向量趋势预测方法 (Vector Trend Forecasting Method, VTFM) 应用于石油价格预测。

最近，Sun 等 (2018) 提出了一种区间分解集成 (interval decomposition ensemble, IDE) 学习方法来预测区间原油价格，IDE学习方法在预测精度和假设检验方面明显优于其他一些基准模型，表明分而治之 (divide and conquer) 的策略可以有效地提高原油价格的预测性能。

4.1.2. 电价预测

电力的现货市场只有提前一天的，这意味着它不允许超过这一期限的竞价。这是由于系统运营商的验证要求，以确保拟议投标在总输电限制范围内的可行性 (Weron，2014)。电力市场中的价格预测是一个复杂的过程，因为价格受到发电和输电的物理限制，以及潜在的市场力量 (Young 等，2014)。利用最大似然法预测电价是这些技术在能源经济学中最古老的应用之一。事实上，在 21 世纪初，出现了一批试图使用传统人工神经网络技术预测电价的论文 (有关综述，请参阅 Weron (2014) 和 Aggarwal 等 (2009) )。原油和电价预测的另一个区别是，电价模型使用了许多物理变量——如温度、风速、生产和输电能力——来显著提高预测的准确性。ML 技术变得特别有用，因为它们可以处理大量的输入，甚至不需要对它们进行预处理和清洗。

一般来说，用于预测电价的模型在技术上更为先进，并且包含复杂而新颖的特征。这在一定程度上是因为电价模型通常是由工程师开发的，他们对 CI 方法有很高的熟练程度。

能源经济学中预测电价的第一篇论文是 Conejo 等 (2005) 的，该论文预测了电力能源市场前一天的 24 个市场清算价格。比较了时间序列分析、人工神经网络和小波的性能。在本研究中，小波模型的结果与 ARIMA 模型相似，而 ANN 模型的表现较差。Lin 等 (2010) 提出了一种用于径向基函数网络 (Radial Basis Function Network, RBFN) 和正交试验设计 (Orthogonal Experimental Design, OED) 相结合的求解过程的增强RBFN (ERBFN)。Khosravi 等 (2013) 采用 Delta 和 Bootstrap 方法构建用于不确定性量化的电价预测区间 (Prediction Intervals, PI)。结果表明，与人工神经网络相比，构造的PIs具有更好的性能。Papadimitriou 等 (2014) 研究了基于支持向量机的次日电价方向变化预测模型的效率。结果表明，支持向量机是一种有效的短期电价预测方法，在 200 天内的预测准确率为 76.12%。He 等 (2015) 提出了一种基于双变量 EMD 去噪 (BED) 的预测方法来跟踪和预测电价变动。在澳大利亚电力市场进行的实证研究表明，结合异质市场特征的 BED 算法在性能上有了显著的改进。

集成方法。与原油的情况类似，集成方法也广泛应用于电力市场 (Mirakyan 等，2017)。Ghasemi 等 (2016) 提出了一种混合算法，该算法由三个主要部分组成：灵活的小波包变换 (FWPT) 将信号分解为不同频率的多个项，并结合新的特征选择方法，即非线性最小二乘支持向量机 (NLSSVM)、ARIMA和TV-SABC，TV-SABC是基于时变系数和绊倒生成算子的人工蜂群优化 (Artificial Bee Colony, ABC) 算法，旨在让学习过程中的NLSSVM参数最优。

多层神经网络。Dudek (2016) 建立了基于前馈神经网络 (FFNN) 的概率电价预测方法。这种方法的优点是它不需要任何特殊的数据预处理，例如去趋势、季节性调整或时间序列的分解。Panapakidis 和 Dagoumas (2016) 研究了基于人工神经网络的日前价格预测模型。Wang 等 (2017) 首先提出了两层分解技术，然后发展了基于快速集成经验模式分解 (Fast Ensemble Empirical Mode Decomposition, FEEMD)、变分模式分解 (VMD) 和基于群智能算法优化的BPNN的混合模型来预测电价，结果表明，该模型预测精度优于一步和多步预测。Singh 等 (2017) 将广义神经元模型应用于澳大利亚电力市场短期电价预测，以克服经典ANN模型的局限性。Yang 等 (2017) 提出了一种结合小波变换、基于自适应PSO (Self-Adapting PSO, SAPSO) 的 KELM 和 ARMA 的混合方法，结果表明，该方法具有较高的精度、通用性和实用性。Bento 等 (2018) 提出了一种短期电价预测方法。该方法基于 Bat 算法、小波变换和人工神经网络。

深度学习。与油价的情况相反，DL被更广泛地用于预测电价。Lago 等 (2018年) 通过四种不同的DL模型实现了高精度。Lago 等 (2018) 使用深度神经网络 (Deep Neural Networks, DNNs) 作为基础模型，将市场整合纳入电价预测。Peng 等 (2018) 将长短期记忆 (Long Short-Term Memory, LSTM) 和差分进化 ( Differential Evolution, DE) 算法应用于电价预测。

基于代理的模型 (ABM)。作业成本法是一种研究复杂系统的方法，其特点是相互作用的主体以及这些主体之间相互作用产生的涌现特性。ABM 通过计算程序模拟这些代理可能使用或不使用机器学习算法。这种方法催生了一种新的经济学范式，即基于主体的计算经济学。关于这一研究领域的全面综述和起源，请参见 Chen (2012)。

在圣达菲研究所 (Santa Fe Institute) 于 20 世纪 90 年代在 ABM 和金融市场方面的开创性工作之后，ABM 还扩展到了其他市场，如 Weidlich 和 Veit (2008) 以及 Guerci 等 (2010) 所述的电力市场。这种方法的主要优点是，它能够在现实的电力网络上对战略行为进行建模，而不必完全求解博弈论上的最佳响应。Young 等 (2014) 研究了使用改进的 Roth 和 Erev 算法 (Erev 和 Roth，1998) 构建和校准的基于代理的模型是否能够从现实电力市场的关键投入预测短期价格，结果表明，该模型能准确地预测价格。Dehghanpour 等 (2018) 采用基于主体的框架，研究空调负荷需求响应的日前零售电能市场行为。

4.1.3. 预测其他能源商品价格

一些论文使用ML方法预测其他能源商品价格，如薪材 (Koutroumanidis 等，2009)、天然气 (Nguyen 和 Nabney，2010；Čeperićet 等, 2017) 和碳价格 (Fan 等，2015；Zhu 等，2017；Sun 等，2016；Zhu 等，2018)。

4.2. 预测/建模能源消耗/需求

了解未来能源需求或消耗水平对于短期和长期规划至关重要。从政府机构到地方当局，再到金融和贸易机构，广大用户都对未来消费组合的现实预测感兴趣。能源消耗预测通常通过使用滞后的消费值和一组外生的社会经济和技术变量 (如人均 GDP、人口和技术趋势) 来处理。

模型的结果要么是特定地区的总能源需求，要么是将需求分解为不同的能源，包括电力需求、天然气需求和成品油需求。预测的频率也可能有很大的不同。电力负荷预测模型需要提供短期 (如每日) 预测，但也常常需要提供长期预测范围。

“价格”预测和“消费”预测之间的一个关键区别是后者不受市场效率动态的影响。消费预测对主体的实际消费几乎没有影响；然而，价格可预测性往往通过为使用该信息的交易员创造机会来抵消自身的影响。此外，价格数据以秒和分钟的频率提供；而消费数据则每月收集一次。因此，提供给ML算法的观测数要小得多。

4.2.1. 长期预测

ML 已用于总能源需求和部门能源需求的长期预测。该领域的一篇典型论文通常使用一组潜在的预测因子 (如 GDP 和人口) ，然后建立一个ML模型来寻找能源消耗和结构变量之间的关系。如果变量之间的关系很复杂，ML模型可能比简单的线性回归模型表现更好。但面临的挑战是，此类应用中的观测数量往往很小，削弱了基于ML的方法的固有优势 (参见 Kaytez 等 (2015) 对多种方法的比较)。

在最近的一次综述中，Debnath 和 Mourshed (2018) 报告说，在所有传统方法和 CI 方法中，ANN 是用于 EPMs 最流行的技术。在 ML 方法的子类别中，支持向量机在流行度和使用频率方面排名第二。一些论文使用人工神经网络模型来预测国家层面的能源消耗。例如，Sözen 和 Arcaklioglu (2007) 以及Sözen 等 (2007) 使用 ANN 方法，利用部门能源消耗预测土耳其的净能源消耗和温室气体排放。同样，Geem 和 Roper (2009) 提出了一个基于人工神经网络的模型来估算韩国的能源需求。在行业层面，Liu 等 (2016) 结合灰色预测方法和反馈神经网络模型，来预测西班牙经济部门的能源消耗。

Tang 等 (2012) 提出了一种集成EEMD和最小二乘支持向量回归 (LSSVR) 的混合集成学习 (EL) 范式，用于核能消耗预测。Tang 等 (2014) 提出了一种数据特征驱动的核能消耗预测建模方法。Li 等 (2018) 基于人工智能算法优化的模型组合预测中国石油消费量。肖等 (2018) 预测了能源消耗的非线性变化。他们使用 AdaBoost 来提高单一非线性预测模型 (包括 BPNN、SVR、GA和RBFNN) 的预测精度。最后，Wang 等 (2018) 通过构建自适应多元优化算法 (AMVO) 来优化支持向量机参数，并应用滚动交叉验证来提高其性能，从而预测中国的能源消耗。Wang 等 (2011) 采用基于季节分解 (SD) 的 LSSVR 集成学习模型对中国水电消耗量进行预测。结果表明，基于 SD 的 LSSVR 集成学习方法是一种非常有前途的季节性复杂时间序列预测方法。Tang 等 (2015) 还提出了一种混合学习范式，通过将Firefly 算法 (FA) 纳入 LSSVR (FA-LSSVR) 来预测中国水电消耗。统计结果证实了基于 FA 的 LSSVR 模型在水平精度和方向精度上优于其他基准模型，包括现有流行的传统计量经济模型、人工智能模型以及类似的混合LSSVR和其他流行的参数搜索工具。

4.2.2. 电力需求预测

电力需求预测是能源经济学的传统领域之一。许多论文 (如 Pao，2006；Azadeh 等，2008；Lai 等，2008；Ardakani 和 Ardehali，2014；Castelli 等，2015) 都建立了混合模型来预测不同国家的低频能源需求趋势。这些论文的总体结构和组成大多看起来相似：传统的时间序列模型，支持向量机，神经网络模型 (尤其是小波神经网络) ，以及最近的前馈和反馈多层模型。 GAs 和 PSO 也经常使用。

4.2.3. 预测智能电网负荷

与国家级预测相比，最大似然法更适合于短期电力需求预测，因为它涉及对大量潜在输入变量的大量高频观测 (例如每天甚至每小时)。利用ML方法研究智能电网电力负荷预测的论文不多，如 Liu 等 (2014)、Coelho 等 (2016)、Bassamzadeh 和 Ghanem (2017)、Mohan 等 (2018)、Anderson 等 (2011)、Li 等 (2018)。Ghasemi 等 (2016) 提出了一种智能电网电力负荷预测的混合算法，主要分为三个部分。第一部分应用 FWPT 将信号分解为不同频率的多个项，并利用条件互信息 (CMI) 和相邻特征选择有价值的输入数据。第二部分是基于 NLSSVM 和 ARIMA 的多输入多输出 (MIMO) 模型，对两个阶段电价与负荷之间的线性和非线性关系进行建模。最后一部分应用一种改进的基于时变系数的人工蜂群 (ABC) 算法和一种称为 TV-SABC 的绊倒生成算子来优化学习过程中的 NLSSVM 参数。一个相关的研究方向是电网故障概率的预测。Rudin 等 (2012) 提出了一种基于电网部件故障可能性的排序算法。利用支持向量机、boosting 和 P-范数 push 对排序目标函数进行排序，得到了该排序算法的特例。

4.2.4. 预测天然气需求

使用 ML 的预测论文包括 Azadeh 等 (2010)、Szoplik (2015)、Panapakidis 和 Dagoumas (2017) 等。

Özmen 等 (2018) 将多元自适应回归样条 (MARS) 和二次曲线 (CMARS) 应用于天然气消费预测。结果表明，MARS 和 CMARS 方法预测天然气的效果优于现有的基于ANN和线性回归的预测方法。Collado 和 Creamer (2016) 使用近似动态规划方法，将时间序列方法 (ARIMA) 与两种机器学习算法 (支持向量机和随机森林) 相结合，预测天然气价格。该方法优于作为本研究基准的 logistic 回归。

4.2.5. 预测运输能源需求

Murat 和 Ceylan (2006) 提出了一种基于监督神经网络的神经网络方法，用于使用社会经济和运输相关指标预测运输能源需求。Limanond 等 (2011) 开发了对数线性回归 (LLR) 模型和人工神经网络模型，以预测泰国的运输能耗。Geem (2011) 开发了 ANN 模型来预测韩国的运输能源需求。Forouzanfar 等 (2012) 提出了一种预测伊朗运输能源需求的多层次遗传规划 (MLGP) 方法。

4.2.6. 预测煤炭需求

很少有论文使用ML技术预测煤炭消费量，如 Yun cai (2003)、Xuemian 和 Guohao (2008)、Yang 等 (2014)。Jia 等 (2007) 采用多输入单输出的支持向量机模型对 1980-2002 年中国煤炭市场需求进行了预测，结果表明，与 RBFNN (基函数神经网络, Radical Basis Function Neural Network) 相比，SVM 预测器具有更高的预测精度和更强的泛化能力。

最后，Genc (2017) 利用 SVM 模型对 2009 年最后一次危机前后的数据进行了拆分，并对原油市场进行了计量分析。

4.3. 其他应用

4.3.1. 模型校准

许多论文采用ML方法进行模型标定。Sun 等 (2011) 利用 ANN 方法识别能源资源供需系统的参数。Amjady 和 Keynia (2010) 提出了一种新的电力解除管制学习算法。

4.3.2. 交易策略

关于交易策略的论文属于ML和优化模型相结合的一个很小的子集。Moreno (2009) 提出了一个基于模糊逻辑和ML的哥伦比亚电力市场交易代理策略模型。Wang 等 (2016) 选择使用天然气的原油期货市场的交易规则。Pinto 等 (2016) 将支持向量机模型用于电力市场的战略竞价。

4.3.3. 能量系统结构

我们发现，ML方法常用于估计能源系统的结构。这些论文旨在揭示各种内部和外部因素对能源消费水平和构成的影响。Fang 等 (2013) 在碳税约束的四维节能减排体系中考察了征收碳税对能源强度和经济增长结果的影响。他们使用人工神经网络来识别实际系统的定量系数。Farajzadeh 和 Nemanllahi (2018) 使用 WNNs 检验回归模型预测能源强度及其组成部分的能力。Ermis 等 (2007) 通过人工神经网络对世界绿色能源消费进行了分析。Ju 等 (2016) 使用一类支持向量机对 19 个主要石油相关国家/地区因石油价格意外变化而产生的宏观经济效应提供补充解释。Ju 等 (2016) 利用人工智能预测中国宏观经济与油价冲击的协动关系。Skiba 等 (2017年) 使用人工神经网络模型估计潜在节能的分布。Sözen (2009年) 使用人工神经网络方法，根据基本能源指标和部门能源消耗，估计土耳其的能源依赖性。Wang 和 Tian (2015) 利用 FFNN 构建了能源价格-能源供应-经济增长动态系统。最后，Zhang 等 (2016) 提出了一个电力供给-消耗-价格的动态系统模型，他们应用人工神经网络辨识电力市场动态系统的参数。

4.3.4. 政策分析

与能源结构建模相关的一个主题是ML在政策分析中的应用。Azadeh 等 (2007) 提出了一种ML方法来衡量效率，作为对以往效率研究中典型方法的补充。该方法发现了输入输出观测数据的随机前沿，不需要对随机前沿的函数形式进行明确的假设。Cinar 等 (2010) 为在未来能源方案的开发中使用天然气的演示以及土耳其的战略能源研究做出了贡献。Granell 等 (2014年) 对 12000 家企业 (44个行业) 的电力使用数据集应用了几种 ML 方法，以评估企业在转换电价方面的收益或损失。Dagoumas 等 (2017) 利用日前电价预测，利用人工神经网络模型研究电力交易商的风险管理。Skiba 等 (2017) 使用人工神经网络估计潜在能源节约的分布，Mashhadi 和 Behdad (2018) 应用最小绝对收缩和选择算子 (LASSO) 回归分析住宅单元的能源消耗。Mahmoud 和 Alajmi (2010) 通过使用人工神经网络的公众意识运动，对能源节约进行了定量评估。Wang 等 (2018) 提出了一种混合 ML 方法，即 EEMD-LSSVM-ARIMA，用于定量分析和预测中国煤炭产能过剩。他们提出了一些限制煤炭产能过剩的政策建议。

4.3.5. 数据管理

具体应用的结果性能取决于使用数据的质量和完整性。与不完整的数据集相比，从完整的数据集得到的结果准确性可能更好 (Abdella 和 Marwala，2005)。丢失的数据在许多应用程序中会带来各种问题。ML是一个强大的工具，可以识别异常值，提供缺失数据的推测，以及缓解与不完整数据相关的潜在问题 (Abdella 和 Marwala，2005；elwamondo 等，2007)。Li 等 (2017) 在大数据驱动模型中使用人工智能方法预测石油价格趋势。Zhang 等 (2018) 将 SVM 和 AdaBoost 等几种 ML 方法应用于数据挖掘和分析，得出 ML 算法可以有效解决能耗数据缺口的结论。

5. 批判性评价

5.1. ML 技术的成就和优势

我们总结了 ML 方法在改进标准计量经济模型上取得的一些成果。

5.1.1. 预测精度的优越性

性能评价指标。文献倾向于报告样本外预测性能上的显著改进。本文采用均方根误差 (RMSE)、平均绝对误差 (MAE)、平均绝对百分率误差 (MAPE)、方向精度 (DA)、Akaike 信息准则 (AIC) 和贝叶斯信息准则 (BIC) 等一系列标准指标评估回归或预测连续变量的性能。使用 ML 算法进行分类的论文通常包括 Matthews 相关系数、检验误差或准确率 (1-检验误差) 来评估 ML 方法与其他统计或计量经济技术相比的预测精度。RMSE、MAE 和 MAPE 表示实际值和预测值之间的差异。因此，如果这些指标的数值越低，那么预测性能就会更好。以百分比表示的 DA 提供了预测方向的正确性，随着 DA 的增加，预测的准确度也越来越高。AIC 和 BIC 奖励预测的准确性，惩罚模型的复杂性，准确率以百分比表示，并使用测试样本提供预测方向的正确性，随着准确率的提高，预测质量也随之提高。Matthews 相关系数 (Matthews，1975) 是预测值和观测值之间的相关系数，它更适用于不平衡样本，因为它避免了由于数据倾斜而导致的精度偏差。

在最近评估方法预测准确性的论文中，Safari 和 Davalou (2018) 是一个特例。例如，在表 6 中，我们报告了 Safari 和 Davallou (2018) 基于上述一些指标的原油价格预测结果，以比较不同方法的性能。可以看出，基于所有的绩效指标，使用 Kalman 滤波的 ESM、ARIMA 和 NAR 的混合 (EWH) 方法优于其他方法，包括 ARIMA 这一流行的传统计量经济模型。

统计检验。有一系列的统计检验，如Wilcoxon符号秩检验 (Wilcoxon Signed Rank Test, WSRT)、预测包容检验 (Forecast Encompassing Test, FET) 和现实检验 (Reality Check, RC) ，它们被用于比较 ML 和计量经济模型的预测结果。WSRT 是最著名和最广泛使用的非参数推断检验 (Gibbons和Chakraborti，2011)。WSRT 的零假设是损失微分序列具有零中位数 (Diebold and Mariano，2002) ，其中和分别是模型 A 和模型 B 的预测误差序列，是损失函数 (例如，均方误差)。对于 FET，采用 Harvey、Leybourne 和 Newbold (HLN) 检验 (Harvey 等，1998) ，零效假设是模型 A 的预测包含模型 B 的预测 (即模型 B 中的所有信息都包含在模型 A 中)。对于 RC，进行卓越预测能力 (Superior Prediction Ability, SPA) 检验 (Hansen，2005)。它是基于怀特的 RC 检验 (怀特，2000) ，更强且更不易受到无关和差的假设的影响。SPA 检验的无效假设是模型 A 的预测性能并不比模型 B 好。

Zhao 等 (2017) 是最近论文在原油价格预测中应用上述三种检验，对一些ML模型和传统计量经济模型 (即随机游走 (RW) 和马尔可夫状态转换 (MRS) ) 进行了统计评估。为了节省空间，我们仅在表 7 中报告了Zhao 等 (2017) 关于 WSRT 的结果。表中列出了模型之间相关统计的 p 值。最后一列中，除第 7 行第 9 列的 p 值外，其余 p 值均小于 0.1，表明在 90% 的置信水平下，SDAE-Bagging 模型的预测值与其他 6 个模型的预测值存在显著差异。值得注意的是，本文已经证明，SDAE-Bagging 模型的 DA 最高，MAP E最低，RMSE 最低，说明该模型的预测性能优于其他模型，因此，从统计学角度也可以得出结论：SDAE-Bagging 模型的预测精度优于其他 6 个模型。

5.1.2. 处理异质性和大量输入的能力

ML 模型，特别是 DL 模型，不受输入变量数量的限制。此功能将建模者从挑选少量具有信息的输入变量的任务中解放出来。ML算法可以接受数百个候选输入变量，而不导致共线性等问题，并且可以选择正确的因子 (或特征) 用于预测。ML 算法通常可以处理一组多样的定量和定性变量。这一能力对能源部门尤其重要，因为它可以使用不同的来源，如来自报告或新闻的文本，并与连续时间序列相结合，以改进预测。

5.1.3. 揭示复杂关系的能力

ML 模型可以检查输入和输出数据之间可能存在的关系的不同拓扑结构。在传统模型领域，贝叶斯模型平均 (BMA) 技术允许在一个数据集上运行一系列模型。然而，BMA 方法要求建模者指定每个模型的结构，ML模型不需要任何结构的预先规范。它们还可以超越线性关系，揭示许多输入变量和期望结果之间复杂、非线性和高维的关系。

5.1.4. 对数据质量的低敏感性

数据稀疏性问题 (如缺少观测值的数据集) 一直是传统计量经济模型的一个问题。在ML社区中已经成功地开发了特定的技术 (例如，Fuzzy 和 GNN 模型) ，允许用甚至不太完美的数据来输入模型。例如，Alobaidi 等 (2018) 就集合模型在有限数据下产生改进预测性能的能力提供了见解。

5.1.5. 有限的预处理所需数据

能源时间序列数据已知包含特定的特征，如季节性、单位根、结构突变、制度转换和异方差，在使用计量经济模型之前必须解决这些特征。另一方面，ML 模型不需要对数据进行主要的预处理，因为它们可以将这些特征视为数据的附加特征。当然，如果已经使用有意义的比率或核变换使特征适应每个预测的要求，那么 ML 算法的性能就会提高。然而，大多数ML方法可能能够捕获这些特定的特征，并将它们合并到最终的预测算法中。

出于比较的原因，在评估多个模型时，应在所有情况下应用相同的数据预处理程序。例如，如果由于单位根问题而在计量经济模型中使用变量的增长，而不是其水平，则在使用 ML 模型时也应应用相同的数据转换。但在为特定预测选择ML模型时，建模者可以对数据进行预处理或者让ML算法找到数据的最佳变换形式。

5.1.6. 灵活应用：回归、分类或排序

许多有监督的ML算法的输出可用于回归、分类或排序。根据研究中的问题，输出可能会发生变化。能源经济学中的许多预测问题可以转化为分类问题来简化计算。例如，一个能源交易员可能更愿意得到次日油价走势强有力的指示，而不是不精确的价格预测。

对于风险管理问题，最大似然法可以对能源网不同组成部分的失效可能性进行排序，这样就可以预见停电等极端事件，并采取预防措施。

5.2. 限制和挑战

5.2.1. 绩效怀疑论

如果基础变量是一个高效市场中的交易资产，那么从定义上来说，提供准确的预测是有挑战的。在这些情况下，即使是花哨复杂的 ML 技术也可能没法根本地提高预测能力，因为市场价格结构已经非常接近模型预测了。例如，Čeperić 等 (2017) 声称，在天然气价格方面，ML 结果的成功在某种程度上被夸大了，因为与传统的时间序列方法相比，它们只显示出轻微的改进。

5.2.2. 过拟合

任何统计预测方法都有过拟合的风险，即试图通过在拟合模型中包含样本噪声来实现训练集下的高精度，而不管测试集的低精度问题。处理这个问题并比较不同算法的常用方法是使用交叉验证来计算测试误差，在这种情况下，测试误差近似于真实测试误差。一些 ML 算法 (如，Random Forests) 也会在内部运行交叉验证，直接避免过拟合。

5.2.3. 泛化能力

与过拟合密切相关的另一个问题是泛化。ML算法的一个主要目的是通过最小化可计算的实证风险来最小化不可计算的预期风险，目的是获得较低的泛化差距 (Kawaguchi 等，2017)。实证风险和预期风险之间的差异被称为泛化差距。泛化差距解释了训练模型对训练数据集的依赖性 (Wickramasinghe 等，2018)。泛化性能差是制约前馈神经网络等ML算法应用的瓶颈 (Xie 等，2018)。为了获得更好的泛化效果，人们提出了许多策略。这些策略统称为“正则化”。正则化是我们对算法做的旨在减少泛化误差而不是训练误差的修改 (Goodfello 等，2016)。正则化可以分为两类：隐式正则化和显式正则化。应该注意的是，这种分类是主观的。两者都控制网络的有效容量，以减少过度拟合 (Hernández García 和 König，2018) ：

隐式正则化：这些正则化方法利用网络结构、学习算法或数据的特性来控制ML算法的有效性。例子：随机梯度下降算法，卷积层，批量归一化。
显式正则化：不涉及网络结构、算法或数据的结构部分的正则化方法，通常可以很容易地添加或删除。示例：权重衰减、丢失、数据增强、随机深度。

5.2.4. 黑箱性质

一些 ML 方法，如 ANN 和 SVM，是已知的黑盒类型，因此与更透明的线性回归模型相比，更难理解结果是如何获得的。然而，一些ML算法 (如决策树) 能够识别每个特征的影响，以及特征之间的线性和非线性关系。

建模者必须解决的主要问题是重点是预测还是解释。对于政策决策或科学研究而言，更重要的是了解不同变量之间的行为和关系，而对于特定的工业应用，如贸易或企业规划，则侧重于预测。

5.2.5. 大数据集的要求

更复杂的模型需要大量的观测数据进行适当的训练和测试。这是 ML 在宏观经济学等领域应用的一个主要障碍，在宏观经济学中，观察值数量非常有限 (如 50-100)。

Dieterich (2000) 认为，应用集成学习方法可以减轻缺乏足够数据来正确表示数据分布带来的风险。在没有足够数据的情况下，可以选择多个具有相同训练精度的假设作为学习算法。因此，集成方法可以通过聚合所有这些候选模型来降低选择错误模型的风险。

此外，建议的补救措施之一是使用经济理论作为变量选择的指导。这种方法已被用于预测通货膨胀和失业等宏观经济变量 (如 Moshiri 等，1999年；Moshiri 和 Cameron，2000；Moshiri 和 Brown，2004) ，也可用于数据频率可能不高的能源消耗等领域。

最后，生物医学工程 (Shaikhina 等，2015) 和材料科学 (Zhang 和 Ling，2018) 等其他领域的一些论文提出了将ML方法应用于小数据集的技术，这些技术可能适用于新兴的经济学文献。

5.2.6. 缺乏统计推断

通常认为，虽然计量经济学方法主要关注回归中系数的统计行为，但 ML 主要关注预测结果 (即 ) 的性质。出于对理论和揭示变量关系的兴趣，经济学家们关注回归中每个自变量的统计意义。另一方面，ML 社区主要是利用所有可能的输入变量来提高预测/预测的准确性。因此，对于自变量的统计显著性 (或 ML 语言中的特征) 几乎没有兴趣。尽管如此，近年来，仍有人试图对 ML 估计结果进行统计检验 (Demšar，2006)。

5.2.7. 估计的稳健性

ML 算法的非线性和动态特性也使得它们对模型设定和训练集的稳健性较差。在设置和校准ML算法时需要特别注意这个问题，因为即使数据集中的微小变化也会导致不同的结果。我们强烈建议，当使用 ML 作为建模工具，将训练数据集拆分为训练和验证数据集时，应当运行多个模型设定和稳健性检验，使用验证数据集对模型进行校准，并且仅在完成模型校准后，使用测试数据集对其进行评估。

5.2.8. 专注于预测市场价格

正如我们在本文中所展示的，有相当一部分的论文专注于预测市场价格。许多没有受过经济学家培训的ML专家并不理解这样一个观点，即ML在预测交易资产方面的广泛应用与预测温度等物理现象不同。预测明天的气温不会改变气候的行为；然而，预测明天的原油价格将立即影响当前的价格，因为它将触发交易活动。从这个意义上说，每一个试图预测价格的ML算法都有对其他算法的外部性。每一个成功的预测模型都给下一个算法增加了难度。由于这一原因，ML在普通能源价格中的应用受到限制，或者算法变得更加复杂，无法捕捉能源市场的新动态。

6. 未来方向的建议

我们从三个角度讨论未来方向。首先，我们讨论如何将当前的实践向前推进一步。然后我们介绍几个应用领域。最后，我们讨论在其他领域常用的方法应用于能源领域的可能性。

6.1. 当前文献的改进

当前有关能量和ML的文献的一个重要局限是，一些论文强调计算机科学的观点，优化计算参数，如准确率，而经济或金融直觉可能被忽略。其他论文集中在经济或金融的角度，没有充分探讨算法解决或解释所研究问题的能力。

另一个方面是，大多数文献使用监督学习算法，而非监督学习方法在营销和风险管理等不同领域的应用非常有限。

一些与营销和客户管理相关的问题可以通过使用聚类技术来解决，比如 K-means，根据不同的人口统计或行为特征以及客户违约或更换公司的可能性来划分客户。

在能源风险管理领域，可以使用主成分分析或排序算法将极端事件识别为异常值。

6.2. 应用未充分利用的方法的机会

理论驱动的 ML：将理论模型与 ML 技术相结合是 ML 研究的核心议题。例如，Gu 等 (2018) 评估了几种 ML 算法，并得出结论，与传统计量经济学方法相比，它们可以改进对资产价格行为的描述，特别是对风险溢价的度量；
深度学习：深度学习技术的最新进展实际上正在彻底改变ML的整个世界。由于其多层结构，DL 方法允许算法更稳健地处理更多的输入。它们也不需要预先指定特性。另一方面，ML 技术通常需要大量的输入观测值，需要花费更多的时间和精力进行校准。因此，不建议将其用于只有有限数量观测值 (例如，几年内的月度数据) 的能源经济应用；但是，当处理大量观测值 (例如，日内贸易数据或基于 GIS 的图像数据) 时，ML 可能是有益的；
自然语言处理 (Natural Language Processing)：处理文本和非结构化数据以生成各种定量代理变量，NLP 正在成为许多经济学和管理学科的标准方法。然而，这种方法尚未广泛应用于能源应用；
社会网络分析：能源市场可以作为一个庞大的网络或多个网络的组合来研究。如停电期间观察到的那样，改变一个网络的效果很快会蔓延到其他地方。因此，利用社会网络分析来评估能源网络 (物理网络 (即智能电网) 或人类网络 (交易员网络)) ，以捕捉能源市场的风险和趋势 (Creamer，2016;；Creamer 和 Creamer，2018) ，这是一个有待探索、极具潜力的领域；

6.3. 未探索的领域

我们的回顾揭示了ML技术在以下应用领域中还没有得到充分的利用。

波动率预测：ML 算法已被用于建模金融数据的波动性。示例包括 SVM (Tang 等，2009) 和 DL (Xiong 等，2015；Chatzis 等，2018)。然而，除了极少数的例子 (例如 Rode 和 Fischbeck，2018) ，我们没有发现其他致力于能源市场的波动性和风险管理建模的论文；
量化非结构化和定性信息：ML提供了强大的工具来量化和分类非结构化和定性数据，用于预测和因果推理。这些方法已经在能量领域得到了应用，但是，ML 在结合定量、定性和非结构化数据方面还有很大的潜力。示例包括各公司基于文本的财务报告和媒体结果来确定其能源和环境状况，使用基于 GIS 的数据来估计能源生产和消费模式，以及使用情绪和社交媒体信息来更好地预测电力消费；
因果和横截面推断：使用 ML 对横截面和面板数据进行统计分析将发现许多不同变量之间的模式。关于 ML 和因果推断结合的理论讨论见 Grimmer (2015) 和 Athey (2015)；
交易策略：学者和企业研究人员经常使用ML技术来制定预测未来经济市场的方法，并设计有效的交易系统以实现利润最大化。特别是，在过去几年中，越来越多的研究人员利用 ML 方法研究不同类型金融工具的价格和波动性 (Cavalcante 等，2016)。
基于ML的优化：在我们的综述中，我们发现几乎没有论文将基于 ML 的分析与最优化技术相结合来解决管理或政策问题。这种组合已被用于其他领域，如投资组合最优化 (Ban 等，2016) 和供应链 (Chi 等，2007)。分析战略互动 (如电力市场竞价) 下的最优行为是一个潜在的富有成果的研究领域。

6.4. ML/AI的经济和组织影响

与其他经济部门类似，能源行业一直并将继续受到 ML 革命的影响。ML 对能源产业结构的长期影响还有待观察和分析。众所周知，ML 技术可以替代和补充人类的技能。如果它们是替代品，它们将取代现有的人力资源，提高自动化水平。在存在互补效应的情况下，ML 将增强现有工人的技能。目前尚不清楚哪种结果将在能源行业的不同子部门占主导地位。

这些力量可能导致行业的重组，也可能导致新形式的市场结构和市场参与者的出现。未来的研究应确定和分析ML对能源效率、智能网络、能源生产成本、能源交易和市场效率以及行业劳动力等领域的影响。

特别是，随着人们对气候变化的日益关注、可再生能源的普及和智能电网的普及，ML/AI 可以用来改进对不稳定可再生能源资源的预测和整合，平衡能源网络，更深刻、更快地了解消费者的需求和需求模式。最后，这里给出了一个简略的开放性问题列表，包括了尚未开发的直接和间接影响：

ML 缓解可再生能源间歇性的潜力；
自动驾驶汽车对各种能源需求的影响；
智能建筑和能源管理系统对整体需求的影响，以及日内能源需求格局的分布；
ML 对能源消耗和气候变化目标 5 的正面 (例如，能源效率) 和负面 (例如，用于计算目的的电力) 影响；
更多智能能源系统可能带来的反弹效应的大小；
当前和未来能源行业劳动力所需的新技能；
有效管理能源系统的人与机器的最佳组合；

7. 结论

我们回顾了大量关于各种 ML 方法的能源经济/金融应用的文献。通过对大量文献的回顾，我们得出以下广泛的结论：

原油和电力价格预测是最流行的应用领域；
支持向量机、神经网络、遗传算法和粒子群算法是最流行的技术；
大多数论文使用结构化数据 (如价格时间序列)。很少有论文使用 ML 来处理非结构化和定性的输入；
使用 DL 方法还有一个尚未开发的机会。

我们希望本文所讨论的应用领域和方法能为读者勾勒该领域最新技术的总体情况。特别是，年轻的研究人员可以利用报告的现状来评估新的创新研究项目。

与经济学的其他领域类似，能源经济学/金融界下一个大步骤是将更透明的经济驱动模型与黑箱型ML系统相结合。此外，该领域还可以受益于采用未充分利用的最新技术，如在其他科学领域使用的 DL 方法。不过，有一点要注意：鉴于主要能源商品的市场比较有效，使用更复杂的方法进行价格预测的好处可能有限。原因在于，如果一些大的市场参与者实施这样的系统，并通过更好地将潜在信息纳入均衡价格，使市场变得更有效率，那么收益甚至会变得更小。这对 ML 在能源经济领域的许多预测应用来说，是一个严重的障碍。我们相信 ML 在建模和预测市场风险方面可能更有用，特别是，如果 ML 技术能与网络模型相结合，更好地捕捉冲击在均衡变量上的传播，ML 可以提高风险管理措施的有效性。

在这项研究中，我们不提供不同方法的性能比较或排名，因为每个模型的准确性关键取决于问题的类型和性质、可用数据和预测范围等因素。未来的研究可以集中于特定领域或应用中各种方法的比较。

8. 相关推文

Note：产生如下推文列表的 Stata 命令为：
lianxh 机器学习 Lasso, m
安装最新版 lianxh 命令：
ssc install lianxh, replace

专题：论文写作

Semantic scholar：一款基于机器学习的学术搜索引擎

专题：Stata教程

Stata-Python交互-7：在Stata中实现机器学习-支持向量机

专题：Stata命令

Lasso一下：再多的控制变量和工具变量我也不怕-T217
Stata新命令-pdslasso：众多控制变量和工具变量如何挑选？

专题：回归分析

Stata：拉索回归和岭回归-(Ridge,-Lasso)-简介
Stata Blogs - An introduction to the lasso in Stata (拉索回归简介)

专题：其它

知乎热议：纠结-计量经济、时间序列和机器学习

专题：机器学习

机器学习：随机森林算法的Stata实现
Lasso：拉索中如何做统计推断
Stata：机器学习分类器大全
Stata：拉索开心读懂-Lasso入门

课程推荐：因果推断实用计量方法
主讲老师：邱嘉平教授
🍓 课程主页：https://gitee.com/lianxh/YGqjp

New！ Stata 搜索神器：lianxh 和 songbl GIF 动图介绍
搜：推文、数据分享、期刊论文、重现代码 ……
👉 安装：
. ssc install lianxh
. ssc install songbl
👉 使用：
. lianxh DID 倍分法
. songbl all

🍏 关于我们

连享会 ( www.lianxh.cn，推文列表) 由中山大学连玉君老师团队创办，定期分享实证分析经验。
直通车： 👉【百度一下：连享会】即可直达连享会主页。亦可进一步添加「知乎」,「b 站」,「面板数据」,「公开课」等关键词细化搜索。