如何攻克“计算机科学的圣杯”？自动机器学习有望让AI大模型在几秒内给出结果

机器学习的研究人员在设计新模型时做出了许多决定，比如他们会决定在神经网络中包含多少层，以及输入值在每个节点上的权重。

德国弗莱堡大学的机器学习实验室负责人弗兰克·哈特（Frank Hutter）表示，所有这些人类决策的结果是，复杂的模型最终是“由直觉设计的”，而不是系统设计的。

如今，一个被称为自动机器学习（AutoML）的领域正在快速发展，旨在消除直觉的主导作用。其核心思想是让算法做出模型的设计决策，而不是研究人员。

这种技术最终可以使机器学习变得更容易获得。尽管自动机器学习已经存在了近十年，但研究人员仍在努力改进它。

最近，一个新会议在美国巴尔的摩举行，组织者称其为“第一次关于这个主题的国际会议”，会上展示了为提高 AutoML 准确性和优化其性能所做的努力。

人们对 AutoML 简化机器学习的潜力非常感兴趣。亚马逊和谷歌等公司已经提供了使用 AutoML 技术的低代码机器学习工具。如果这些技术变得更有效，它就可以加速研究，并允许更多的人使用机器学习。

核心思想是为了让人们能够选择一个他们想问的问题，指派一个 AutoML工具，最终收到他们想要的结果。

会议组织者之一、美国怀俄明大学的助理教授拉尔斯·科托夫（Lars Kotthoff）表示，这个愿景是“计算机科学的圣杯”，“由你来指定问题，计算机确定如何解决它——你只需要做这些。”但首先，研究人员必须弄清楚如何使这些技术更节省时间和能源。

（来源：MS TECH）

什么是 AutoML？

乍一看，AutoML 的概念似乎是多余的——毕竟，机器学习已经在自动化从数据中获取见解的过程了。

但是，由于 AutoML 算法在底层机器学习模型之上的抽象层上运行，只利用这些模型的输出作为指导，因此它们可以节省时间和计算。研究人员可以将 AutoML 技术应用于预训练模型，以获得新的见解，而无需在重复现有研究方面浪费算力。

例如，美国富士通研究中心的研究科学家迈赫迪·巴拉米（Mehdi Bahrami）和他的合作者展示了最近的工作，即如何使用具有不同预训练模型的 BERT-sort 算法，以适应新的目的。

BERT-sort 是一种算法，在数据集上训练时，它可以计算出所谓的“语义顺序”。例如，给定一套电影评论数据，它可以知道“杰出（great）”电影的排名高于“好（good）”和“坏（bad）”电影。

用 AutoML 技术，算法学习到的语义顺序也可以用在癌症诊断分析，甚至是韩文文本分类等任务上，减少时间和计算。巴拉米说：“BERT 需要几个月的计算，而且非常昂贵，模型的生成和重复就要花上 100 万美元。

所以，如果每个人都想做同样的事情，它又是很昂贵、浪费的，那其实对世界并不友好。”尽管该领域展示出了希望，但研究人员仍在寻找使 AutoML 技术提高计算效率的方法。

例如，像神经架构搜索这样的方法，目前正在构建和测试许多不同的模型，以找到最佳拟合，而完成所有这些迭代所需的能源是不可小觑的。AutoML 技术也可以应用于不涉及神经网络的机器学习算法，比如创建随机决策森林或支持向量机来对数据进行分类。

这些领域的研究更加深入，许多编码库已经适用于那些想要将 AutoML 技术整合到项目中的人。会议组织者弗兰克·哈特（Frank Hutter）表示，下一步是使用 AutoML 来量化不确定性，并解决算法中的可信度和公平性问题。

在这一愿景中，围绕可信度和公平性的标准将类似于任何其他机器学习的限制，比如准确性。而 AutoML 可以在算法发布之前识别并自动纠正被发现的偏见。

探索仍在继续

但对于深度学习而言，AutoML 还有很长的路要走。用于训练深度学习模型的数据，如图像、文档和语音，通常是密集而复杂的。

它需要巨大的计算能力来处理。训练这些模型的成本和时间都令人望而却步，只有在财力雄厚的私人公司工作的研究人员才能从事。会议上的一个比赛要求参与者开发神经结构搜索的节能替代算法，这是一个相当大的挑战，因为这种技术有着极高的计算要求。

它会自动在无数个深度学习模型中循环，帮助研究人员为他们的应用选择正确的模型，但这个过程可能需要几个月，花费超过 100 万美元。这些被称为“零成本神经架构搜索代理”的替代算法的目标是，通过显著减少其计算程度，使神经架构搜索更容易访问和环保。

最终他们希望在几秒钟之内得到结果，而不是几个月。不过这些技术仍处于开发的早期阶段，通常是不可靠的，但机器学习研究人员预测，它们拥有很大潜力，能过让模型选择过程更高效。

支持：Ren

原文：

https://www.technologyreview.com/2022/08/05/1056814/automation-ai-machine-learning-automl/