大部分讨论都反映了 ML 的 EO 应用在服务实际应用方面取得了多大进展。为了造福社会,理想的人工智能工具应该是可复制、可扩展、可维护、可转移和可解释的。他们需要与现有的非人工智能(AI)工具很好地集成而不是竞争,即旨在完全取代最先进的方法。此外,“训练一次”的方法通常需要通过不断学习和根据新观察进行再训练来取代。寻找足够训练数据这一长期存在的问题引发了以下应用程序之间的对比:可以使用非专家标签(可通过公民科学或游戏化实现)的应用程序(例如,zooniverse.org)、需要领域专家进行标签的应用程序以及需要“地面实况”观察的应用程序。更广泛的人工智能社区的发展可能会有所帮助,包括“一次性”学习的想法(人类只需要看到一只斑马)、元学习(学习如何学习)以及在 EO 中使用非域基础模型的可能性(基础模型能否从猫和狗过渡到农作物类型识别?)另一个广泛认可的问题是使用内部计算资源还是基于云的计算资源之间的选择 。后者很有吸引力,因为可以轻松访问复杂的 TPU 和 GPU 以加速训练,并且可以在此后快速扩展应用程序。但人们提出了一些问题,包括与内部硬件相关的费用、对应用程序可能被锁定的私有后端的依赖、明显缺乏支持以及对数据保护和安全性的怀疑。
Rossella Arcucci(伦敦帝国理工学院)和 Marcin Chrust(ECMWF)共同主持了该工作组,该工作组探索了混合 ML 和 DA 方法的利用。来自学术界、工业界、数值天气预报中心和研究中心的众多成员从改进 DA 建模的角度参与了关于 ML 与 DA 的潜在使用的积极讨论。基于 ML 和 DA 的混合方法在 DA 领域变得越来越流行,其应用范围从使用神经网络来模拟 DA 中的模型组件,到使用基于 ML 的模拟器或定制技术完全取代成熟的 DA 算法。后者包括估计后验协方差的扩展 Elman 网络和用联合模型和求解器学习替代 4D-Var 的循环神经网络。大量文献也致力于在 ML 算法的潜在空间中执行 DA,平衡准确性和计算成本。当从贝叶斯角度结合 DA 和 ML 框架时,概率 ML 方法和微分方程之间的联系就会凸显出来。这种等价性证明了两个领域之间的相似之处,在参考文献中正式提出 。
限制、机遇和挑战
鉴于所涉及系统的高维性质带来的困难,学习完整模型或用 ML 方法替换 DA 算法在操作环境中仍然被认为具有挑战性。将基于物理的模型与统计模型相结合的混合模型的开发已被提议作为一种有吸引力的替代方案。事实证明,用于校正基于物理的模型的统计模型可以依赖于情况并在 4D-Var框架内进行训练。大家一致认为,开发一个通用的 ML-DA 框架将有可能发挥这两种方法的优势。尤其是机器学习,可能会提供超越数值天气中心当前使用的 DA 方案所施加的线性和高斯性约束的机会,同时还可以显着降低分析过程的成本。随着未来模型分辨率和分析的提高,后一个方面变得越来越重要。
未来发展方向
ML 与 DA 的结合推进了各个领域和应用中 ML 建模的最先进水平。这个快速发展领域的发展趋势和未来挑战包括学习 DA 中的状态观测映射或开发 DA 辅助的动力系统的 ML 替代品。工作组参与者达成了广泛共识,即传统的 DA 方法可用于改进 ML 算法,特别是在解决与噪声、不完整或有偏差数据相关的问题时。这些混合模型在可解释性和降噪方面具有优势。进一步突破性进展的巨大空间仍然存在,特别是在作战环境中应用这些方法时。
TA3:用于模型仿真和模型发现的机器学习
当前的机器学习应用
该工作组由 Massimo Bonavita 和 Matthew Chantry(均为 ECMWF)担任主席。在评估模型仿真领域的现状时,该小组看到了各种各样的方法,从学习模拟天气或气候模型的一个组成部分,到学习模拟整个现实天气模型。后一种方法在过去一年中取得了重大进展,据称一些机器学习模型已经与确定性预测的最先进的操作模型具有竞争力。模型发现目前不太常见,但在预测异常波浪等方面的成功工作为成功应用提供了蓝图。
限制、机遇和挑战
机器学习模型的训练被认为过度依赖均方误差(或类似构造的)损失函数,这有其缺点,因为针对该指标训练的模型会做出谨慎且过于平滑的预测,这可能会限制现实世界的应用。详细讨论了使用生成对抗网络(GAN)、扩散模型等的可能性。此外,使用概率损失函数而不是确定性损失函数来训练 ML 模型的一般方法被认为是一种有前途的前进方向。
该工作组由 Claudia Vitolo 和 Bertrand Le Saux(均来自 ESA)担任主席,并聚集了大批不同的专家,因为机器学习现在已渗透到地球系统科学和工业的所有领域。例如,在天气和气候领域,深度学习据报道可用于降水临近预报、极端天气事件检测、预测后处理(例如,降尺度,以及在较长时间尺度上分析气候和天气过程。在环境应用中,参与者报告称已使用 ML 从各个领域的 EO 数据中获取可操作的信息,包括公共卫生、农业、环境保护(陆地和海上)仅举几例。还提到了一些引人注目的工业应用,包括飞行期间规划(航空部门)、道路维护规划(交通运输部门)、能源需求和分配规划以及(再)保险。与会者还简要介绍了机器学习在不久的将来可能为安全或政策制定提供有希望的应用的新兴领域,这些应用建立在联邦学习、机载处理、数字孪生技术和量子机器学习的基础上。
讨论和演示中出现了多种观点。新技术和框架的开发被认为对社会(用于复杂数值模型的低成本加速、快速模拟)和气候(用于改善早期预警并针对影响许多部门(例如能源)的挑战确定新的可持续环境解决方案)具有高度影响。据几位参与者称,Transformer 模型和可解释的 ML 被认为非常有希望克服当前对黑盒模型缺乏信任的问题。人工智能预计将越来越多地用于极端天气事件预测和耦合各种地球系统过程的数字孪生建模。从长远来看,需要研究地球系统科学中的绿色计算、操作化、透明的机器学习和过程理解。
TA5:边缘机器学习和高性能计算
当前的机器学习应用
在研讨会期间,具有变革能力的新型计算是普遍讨论的话题。随着计算技术的快速进步,机器学习增强型高性能计算已成为地球科学研究中越来越重要的工具,巴塞罗那超级计算中心的 Carlos Alberto Gómez Gonzalez 在其关于用于获得精细分辨率下的二氧化氮或降水场估计的经验降尺度的深度学习的演讲中阐述了这一点。在计算机功率谱的另一端,边缘机器学习的机载处理已被证明对地球观测有用,因为它可以实时处理卫星数据并对洪水等事件做出即时响应。它还有助于降低数据传输成本,因为数据在传输到地面之前会在卫星本身上进行处理。
限制、机遇和挑战
模块化计算环境,即集成不同类型计算资源的系统,被视为为大规模计算应用程序提供一定程度的灵活性和可扩展性的一种方式。因此,复杂模拟的程序部分可以分布在多个模块上,以便可以最佳地利用各种硬件属性。这还允许添加和删除组件,以满足不断变化的需求和要求,或集成量子计算或神经形态模块等未来技术。基于这一原理构建的更强大的超级计算机可能是进入百亿亿次计算时代的途径。面对本世纪的新挑战,可能需要这种能力:以足够的精度运行数值模型,以预测局部范围内的天气事件,或支持数字孪生的开发,以监测、预测和评估气候变化的影响,正如 NASA 的 Jacqueline Lemoigne 在她的演讲中提到的,并展示了 IDEAS等示例。
未来发展方向
许多令人兴奋的观点被提出和讨论。太空中的分布式计算可能会提供优化小型传感卫星和具有计算有效载荷的卫星之间的协作的可能性,并实现太空中的认知云计算(C3S)。德国航天中心的 Lisa Woerner 强调了量子技术在全球地球观测中减少气候变化影响的潜力。她特别强调了量子计算和量子机器学习的前景,通过进一步探索未充分利用的机器学习领域(例如强化学习)可以获得潜在的好处。来自 ESA 的 Bertrand Le Saux 详细介绍了将量子计算的力量带入地球观测的持续努力,并介绍了将量子机器学习用于此类经典数据的两个研究领域:量子内核和混合经典量子神经网络。他们已经为基于门的量子计算机或量子退火器上的图像分类以及时间序列分析提供了第一个概念证明。这些混合量子经典架构构成了可在模块化 HPC 上运行的下一代 ML 的基础。
Bonavita, M., Schneider, R., Arcucci, R. et al. 2022 ECMWF-ESA workshop report: current status, progress and opportunities in machine learning for Earth System observation and prediction. npj Clim Atmos Sci 6, 87 (2023). https://doi.org/10.1038/s41612-023-00387-2IF: 9.0 Q1