编者按:本文主要摘译自下文,特此致谢! Source:Ghoddusi H, Creamer G G, Rafizadeh N. Machine learning in energy economics and finance: A review[J]. Energy Economics, 2019, 81: 709-727. -PDF-
ML 也被广泛应用于能源市场的经济和金融分析,如价格预测和风险管理。比较 ML 与传统计量经济模型 (如 ARIMA 或 GARCH) 的一些特征,可以揭示 ML 在能源经济学中日益流行的一些原因。与经典统计/计量经济学方法相比,ML 方法的优点是能够管理大量的结构化和非结构化数据,并能快速做出决策或预测。ML 方法的重点是在给定其他变量的情况下,对某些结果变量做出准确的预测,因此 ML 模型没有对方程的函数形式、变量之间的相互作用和参数的统计分布作出任何先验的假设,这使得大规模数据处理和快速预测成为可能。
尽管 ML 在能源经济学中得到了广泛的应用,但据我们所知,还没有一篇综述论文系统地回顾了现有的文献。本文旨在回顾最近发表在各种能源相关和经济相关期刊上的文章。我们的综述集中在四个主要问题上:
我们并不是第一个写一篇关于 ML 在能源领域应用的综述性论文。在相关或邻近的科学领域中有一些调查。例如,Voyant 等 (2017) 调查了用于预测太阳辐射的 ML 方法,Perera 等 (2014) 讨论了 ML 在可再生能源整合中的应用,Zemene 和 Khedkar (2017) 比较了用于确定客户电力消耗的 ML 算法。我们的重点主要是能源经济学和能源金融应用,因此,我们没有对能源工程应用中的 ML/AI 进行深入分析。尽管 Weron (2014) 没有特别关注 ML 技术,但他对用于电价预测的方法进行了综述。因此,可以将其视为对我们综述的补充。Debnath 和 Mourshed (2018) 回顾了用于能源规划模型 (Energy Planning Models, EPM) 的预测模型,并报告了人工神经网络 (ANN) 作为最流行的预测方法。Mullainathan 和 Spiess(2017)、Athey (2017) 提供了 ML 的非技术概述和经济/计量经济应用的回顾。经济学界主要关注 ML 在理论检验和因果推断方面的优势和局限,而能源界对这方面的关注较少,对应用主题更感兴趣。
本文的结构如下:第二节介绍了本研究所采用的研究方法;第三节报告了统计结果;第四节详细介绍了 ML 在特定领域的应用;第五节批判性地回顾了现有文献;第六节提出了建议和对未来的展望;最后,在附录 A 中快速概述了主要的 ML 技术和概念。
2. 研究方法
本文的重点是 ML 在能源经济/金融领域的应用。能源经济/金融和能源工程之间的界限既不严格也不明确。虽然有些主题属于一个领域 (例如,反应堆优化是一个明确的工程主题,期货交易策略是一个明确的经济学主题),但不同子领域之间存在灰色区域 (例如,电力负荷和价格预测)。我们广义地定义能源经济学/金融应用为所有涉及价格、投资、企业和消费者的最佳行为,以及公共政策等任何形式的市场相关变量议题的研究。
我们有丰富的关键词和期刊,以及高被引论文的引文,希望我们对文献的全面搜寻能够带来比较公正的看法。三种专门的电气工程期刊 (IEEE Transactions on Power Systems, Electric Power Systems Research, and International Journal of Electrical Power & Energy Systems) 包含了大量关于能源经济学和能源系统工程的论文。但我们不将其包括在综述中,因为其他针对电力市场预测的调查 (Weron,2014) 对这些类型的论文提供了更深入更专业的介绍。我们的搜索可能会忽略一些发表在经济学主流以外的期刊上的论文 (例如,当地经济学或计算机科学期刊或技术会议论文集)。因此我们报告的数字可能低于标准文献计量来源 (如科学网或 Scopus) 的数字。这对我们来说是一个小问题,因为我们的目标是对大多数相关论文 (发表在高影响力期刊上) 的内容和方法进行深入综述,而不仅仅是提供统计分析。我们的综述也可能遗漏一些非公开的内容,这些内容涉及能源行业中 ML 应用的进展 (例如,用于贸易或风险管理目的的专有算法和技术),因此报告的结果可能低估了该领域的前沿知识水平。
Conejo et al. (2005), Moshiri and Foroutan (2006), Shambora and Rossiter (2007), Yu et al. (2008), Ghaffari and Zare (2009), Koutroumanidis et al. (2009), Nguyen and Nabney (2010), Lin et al. (2010), Movagharnejad et al. (2011), Jammazi and Aloui (2012), Khosravi et al. (2013), Godarzi et al. (2014), Tang et al. (2015a), Young et al. (2014), Yu et al. (2014), Papadimitriou et al. (2014), Chiroma et al. (2015), Zhang et al. (2015), Yu et al. (2015), He et al. (2015), Ghasemi et al. (2016), Zhu et al. (2016), Yu et al. (2016a), Keles et al. (2016), Dudek (2016), Panapakidis and Dagoumas (2016), Wang and Wang (2016), Yu et al. (2016b), Baruník and Malinska (2016), Yu et al. (2017a), Dagoumas et al. (2017), Mirakyan et al. (2017), Zhu et al. (2017), Wang et al. (2017), Čeperić et al. (2017), Han et al. (2017), Singh et al. (2017), Zhao et al. (2017), Yang et al. (2017), Yu et al. (2017b), Safari and Davallou (2018), Zhu et al. (2018), Cheng et al. (2018a), Cheng et al. (2018b), Marcjasz et al. (2018), Lago et al. (2018a), Chai et al. (2018), Lago et al. (2018b), Huang and Wang (2018), Tang et al. (2018b), Tang et al. (2018a), Peng et al. (2018), Zhao et al. (2018), Wang et al. (2018e), Wang et al. (2018f), Bekiroglu et al. (2018), Bento et al. (2018), Dogah and Premaratne (2018), Ding (2018), Sun et al. (2018)
ANN, EMD-NNEL,SC, ARIMA–ANN, RBFN, AAL, AI, SVM, LSSVM–PSO, CEEMD-EELM, DEL, BED, NLSSVM, FFNN, BPNN, DL, KEL, NARNN, GA, GA-LSSVM, VEC-NARNN, NARX, EEMD-RVFL, PPM-KM, LSTM-DE, SR-FNN, VTFM, DFN, AIC-ANN, IDE
Predicting/modeling energy consumption/demand
Pao (2006), Murat and Ceylan (2006), Azadeh and Tarverdian (2007), Sözen et al. (2007), Sözen and Arcaklioglu (2007), Hamzaçebi (2007), Lai et al. (2008), Azadeh et al. (2008), Ünler (2008), Wang et al. (2009), Geem and Roper (2009), Azadeh et al. (2010), Ekonomou (2010), Kavaklioglu (2011), Kankal et al. (2011), Adam et al. (2011), Limanond et al. (2011), Geem (2011), Wang et al. (2011), Tang et al. (2012), Forouzanfar et al. (2012), Yu et al. (2012), Kialashaki and Reisel (2013), An et al. (2013), Liu et al. (2014), Ardakani and Ardehali (2014), Tang et al. (2014), Szoplik (2015), Antanasijević et al. (2015), Tang et al. (2015b), Castelli et al. (2015), Coelho et al. (2016), Ghasemi et al. (2016), Günay (2016), Kaboli et al. (2016), Liu et al. (2016), Panapakidis and Dagoumas (2017), Kaboli et al. (2017), Bassamzadeh and Ghanem (2017), Zeng et al. (2017), Özmen et al. (2018), Li et al. (2018a), Xiao et al. (2018), Chen et al. (2018), Wang et al. (2018d),
Alobaidi et al. (2018), Hong et al. (2018), Wang et al. (2018g), Mohan et al. (2018), Li et al. (2018b)
Amjady and Keynia (2010), Sun et al. (2011), Genc (2017)
MLPNN, NN, SVM
Trading strategies
Moreno (2009), Wang et al. (2016), Pinto et al. (2016)
AI, GA, SVM
Structure of energy systems
Ermis et al. (2007), Sözen (2009), Fang et al. (2013), Wang and Tian (2015), Ju et al. (2016a), Zhang et al. (2016), Ju et al. (2016b), Skiba et al. (2017), Farajzadeh and Nematollahi (2018)
WNN, One-Class SVM, AI, ANN
Policy analysis
Azadeh et al. (2007), Cinar et al. (2010), Mahmoud and Alajmi (2010), Granell et al. (2014), Dagoumas et al. (2017), Skiba et al. (2017), Mashhadi and Behdad (2018), Wang et al. (2018a)
NN, GA, SVM, ANN, LASSO, EEMD-LSSVM-ARIMA
Data management
Li et al. (2017), Zhang et al. (2018)
AL, SVM, AdaBoost
4. 详细综述:应用领域
现有的 ML方法在能源经济学相关论文中的应用可分为两大类:(1) 预测能源商品价格;(2) 预测/建模能源消费/需求。然而,许多论文在一个特定的能源经济学情景中使用 ML 方法。大多数论文主要采用个别 ML 技术或混合 ML/统计计量经济学技术。
4.1. 预测能源价格
能源商品价格序列通常表现出复杂的特征,如非线性、滞后项依赖性、非平稳性和波动聚集性,这使得简单的传统模型效果不佳 (Cheng 等,2018)。ML 方法可以提供更好的预测性能,因为它们在处理复杂的内部动态时具有更高的灵活性。绝大多数侧重于价格预测的论文要么考虑原油价格预测,要么考虑电力价格预测,预测天然气价格的论文要少得多。在煤炭作为主要能源的情况下,我们还没有发现任何主要的论文使用 ML 技术预测煤炭价格。
4.1.1. 原油价格预测
有关原油价格预测的论文主要基于人工神经网络的高级和混合版本,支持向量机模型的使用较少。此外,近年来,集成方法已变得越来越普遍。作为早期的成功案例之一,Moshiri 和 Foroutan (2006) 利用非线性 ANN 模型预测了原油期货价格的日度序列,其预测效果优于传统的计量经济模型。从那时起,基本模式已扩展到多个方向。
ML 模型,特别是 DL 模型,不受输入变量数量的限制。此功能将建模者从挑选少量具有信息的输入变量的任务中解放出来。ML算法可以接受数百个候选输入变量,而不导致共线性等问题,并且可以选择正确的因子 (或特征) 用于预测。ML 算法通常可以处理一组多样的定量和定性变量。这一能力对能源部门尤其重要,因为它可以使用不同的来源,如来自报告或新闻的文本,并与连续时间序列相结合,以改进预测。
5.1.3. 揭示复杂关系的能力
ML 模型可以检查输入和输出数据之间可能存在的关系的不同拓扑结构。在传统模型领域,贝叶斯模型平均 (BMA) 技术允许在一个数据集上运行一系列模型。然而,BMA 方法要求建模者指定每个模型的结构,ML模型不需要任何结构的预先规范。它们还可以超越线性关系,揭示许多输入变量和期望结果之间复杂、非线性和高维的关系。
能源时间序列数据已知包含特定的特征,如季节性、单位根、结构突变、制度转换和异方差,在使用计量经济模型之前必须解决这些特征。另一方面,ML 模型不需要对数据进行主要的预处理,因为它们可以将这些特征视为数据的附加特征。当然,如果已经使用有意义的比率或核变换使特征适应每个预测的要求,那么 ML 算法的性能就会提高。然而,大多数ML方法可能能够捕获这些特定的特征,并将它们合并到最终的预测算法中。
出于比较的原因,在评估多个模型时,应在所有情况下应用相同的数据预处理程序。例如,如果由于单位根问题而在计量经济模型中使用变量的增长,而不是其水平,则在使用 ML 模型时也应应用相同的数据转换。但在为特定预测选择ML模型时,建模者可以对数据进行预处理或者让ML算法找到数据的最佳变换形式。
通常认为,虽然计量经济学方法主要关注回归中系数 的统计行为,但 ML 主要关注预测结果 (即 ) 的性质。出于对理论和揭示变量关系的兴趣,经济学家们关注回归中每个自变量的统计意义。另一方面,ML 社区主要是利用所有可能的输入变量来提高预测/预测的准确性。因此,对于自变量的统计显著性 (或 ML 语言中的特征) 几乎没有兴趣。尽管如此,近年来,仍有人试图对 ML 估计结果进行统计检验 (Demšar,2006)。
5.2.7. 估计的稳健性
ML 算法的非线性和动态特性也使得它们对模型设定和训练集的稳健性较差。在设置和校准ML算法时需要特别注意这个问题,因为即使数据集中的微小变化也会导致不同的结果。我们强烈建议,当使用 ML 作为建模工具,将训练数据集拆分为训练和验证数据集时,应当运行多个模型设定和稳健性检验,使用验证数据集对模型进行校准,并且仅在完成模型校准后,使用测试数据集对其进行评估。
与经济学的其他领域类似,能源经济学/金融界下一个大步骤是将更透明的经济驱动模型与黑箱型ML系统相结合。此外,该领域还可以受益于采用未充分利用的最新技术,如在其他科学领域使用的 DL 方法。不过,有一点要注意:鉴于主要能源商品的市场比较有效,使用更复杂的方法进行价格预测的好处可能有限。原因在于,如果一些大的市场参与者实施这样的系统,并通过更好地将潜在信息纳入均衡价格,使市场变得更有效率,那么收益甚至会变得更小。这对 ML 在能源经济领域的许多预测应用来说,是一个严重的障碍。我们相信 ML 在建模和预测市场风险方面可能更有用,特别是,如果 ML 技术能与网络模型相结合,更好地捕捉冲击在均衡变量上的传播,ML 可以提高风险管理措施的有效性。