
机器学习的研究人员在设计新模型时做出了许多决定,比如他们会决定在神经网络中包含多少层,以及输入值在每个节点上的权重。
德国弗莱堡大学的机器学习实验室负责人弗兰克·哈特(Frank Hutter)表示,所有这些人类决策的结果是,复杂的模型最终是“由直觉设计的”,而不是系统设计的。
如今,一个被称为自动机器学习(AutoML)的领域正在快速发展,旨在消除直觉的主导作用。其核心思想是让算法做出模型的设计决策,而不是研究人员。
这种技术最终可以使机器学习变得更容易获得。尽管自动机器学习已经存在了近十年,但研究人员仍在努力改进它。
最近,一个新会议在美国巴尔的摩举行,组织者称其为“第一次关于这个主题的国际会议”,会上展示了为提高 AutoML 准确性和优化其性能所做的努力。
人们对 AutoML 简化机器学习的潜力非常感兴趣。亚马逊和谷歌等公司已经提供了使用 AutoML 技术的低代码机器学习工具。如果这些技术变得更有效,它就可以加速研究,并允许更多的人使用机器学习。
核心思想是为了让人们能够选择一个他们想问的问题,指派一个 AutoML工具,最终收到他们想要的结果。
会议组织者之一、美国怀俄明大学的助理教授拉尔斯·科托夫(Lars Kotthoff)表示,这个愿景是“计算机科学的圣杯”,“由你来指定问题,计算机确定如何解决它——你只需要做这些。”但首先,研究人员必须弄清楚如何使这些技术更节省时间和能源。
(来源:MS TECH)

什么是 AutoML?
乍一看,AutoML 的概念似乎是多余的——毕竟,机器学习已经在自动化从数据中获取见解的过程了。
但是,由于 AutoML 算法在底层机器学习模型之上的抽象层上运行,只利用这些模型的输出作为指导,因此它们可以节省时间和计算。研究人员可以将 AutoML 技术应用于预训练模型,以获得新的见解,而无需在重复现有研究方面浪费算力。
例如,美国富士通研究中心的研究科学家迈赫迪·巴拉米(Mehdi Bahrami)和他的合作者展示了最近的工作,即如何使用具有不同预训练模型的 BERT-sort 算法,以适应新的目的。
BERT-sort 是一种算法,在数据集上训练时,它可以计算出所谓的“语义顺序”。例如,给定一套电影评论数据,它可以知道“杰出(great)”电影的排名高于“好(good)”和“坏(bad)”电影。
用 AutoML 技术,算法学习到的语义顺序也可以用在癌症诊断分析,甚至是韩文文本分类等任务上,减少时间和计算。巴拉米说:“BERT 需要几个月的计算,而且非常昂贵,模型的生成和重复就要花上 100 万美元。
所以,如果每个人都想做同样的事情,它又是很昂贵、浪费的,那其实对世界并不友好。”尽管该领域展示出了希望,但研究人员仍在寻找使 AutoML 技术提高计算效率的方法。
例如,像神经架构搜索这样的方法,目前正在构建和测试许多不同的模型,以找到最佳拟合,而完成所有这些迭代所需的能源是不可小觑的。AutoML 技术也可以应用于不涉及神经网络的机器学习算法,比如创建随机决策森林或支持向量机来对数据进行分类。
这些领域的研究更加深入,许多编码库已经适用于那些想要将 AutoML 技术整合到项目中的人。会议组织者弗兰克·哈特(Frank Hutter)表示,下一步是使用 AutoML 来量化不确定性,并解决算法中的可信度和公平性问题。
在这一愿景中,围绕可信度和公平性的标准将类似于任何其他机器学习的限制,比如准确性。而 AutoML 可以在算法发布之前识别并自动纠正被发现的偏见。

探索仍在继续
但对于深度学习而言,AutoML 还有很长的路要走。用于训练深度学习模型的数据,如图像、文档和语音,通常是密集而复杂的。
它需要巨大的计算能力来处理。训练这些模型的成本和时间都令人望而却步,只有在财力雄厚的私人公司工作的研究人员才能从事。会议上的一个比赛要求参与者开发神经结构搜索的节能替代算法,这是一个相当大的挑战,因为这种技术有着极高的计算要求。
它会自动在无数个深度学习模型中循环,帮助研究人员为他们的应用选择正确的模型,但这个过程可能需要几个月,花费超过 100 万美元。这些被称为“零成本神经架构搜索代理”的替代算法的目标是,通过显著减少其计算程度,使神经架构搜索更容易访问和环保。
最终他们希望在几秒钟之内得到结果,而不是几个月。不过这些技术仍处于开发的早期阶段,通常是不可靠的,但机器学习研究人员预测,它们拥有很大潜力,能过让模型选择过程更高效。
支持:Ren
原文:
https://www.technologyreview.com/2022/08/05/1056814/automation-ai-machine-learning-automl/

