Py学习  »  机器学习算法

如何攻克“计算机科学的圣杯”?自动机器学习有望让AI大模型在几秒内给出结果

DeepTech深科技 • 3 年前 • 450 次点击  


机器学习的研究人员在设计新模型时做出了许多决定,比如他们会决定在神经网络中包含多少层,以及输入值在每个节点上的权重。


德国弗莱堡大学的机器学习实验室负责人弗兰克·哈特(Frank Hutter)表示,所有这些人类决策的结果是,复杂的模型最终是“由直觉设计的”,而不是系统设计的。


如今,一个被称为自动机器学习(AutoML)的领域正在快速发展,旨在消除直觉的主导作用。其核心思想是让算法做出模型的设计决策,而不是研究人员。


这种技术最终可以使机器学习变得更容易获得。尽管自动机器学习已经存在了近十年,但研究人员仍在努力改进它。


最近,一个新会议在美国巴尔的摩举行,组织者称其为“第一次关于这个主题的国际会议”,会上展示了为提高 AutoML 准确性和优化其性能所做的努力。


人们对 AutoML 简化机器学习的潜力非常感兴趣。亚马逊和谷歌等公司已经提供了使用 AutoML 技术的低代码机器学习工具。如果这些技术变得更有效,它就可以加速研究,并允许更多的人使用机器学习。


核心思想是为了让人们能够选择一个他们想问的问题,指派一个 AutoML工具,最终收到他们想要的结果。


会议组织者之一、美国怀俄明大学的助理教授拉尔斯·科托夫(Lars Kotthoff)表示,这个愿景是“计算机科学的圣杯”,“由你来指定问题,计算机确定如何解决它——你只需要做这些。”但首先,研究人员必须弄清楚如何使这些技术更节省时间和能源。


(来源:MS TECH)


什么是 AutoML?


乍一看,AutoML 的概念似乎是多余的——毕竟,机器学习已经在自动化从数据中获取见解的过程了。


但是,由于 AutoML 算法在底层机器学习模型之上的抽象层上运行,只利用这些模型的输出作为指导,因此它们可以节省时间和计算。研究人员可以将 AutoML 技术应用于预训练模型,以获得新的见解,而无需在重复现有研究方面浪费算力。


例如,美国富士通研究中心的研究科学家迈赫迪·巴拉米(Mehdi Bahrami)和他的合作者展示了最近的工作,即如何使用具有不同预训练模型的 BERT-sort 算法,以适应新的目的。


BERT-sort 是一种算法,在数据集上训练时,它可以计算出所谓的“语义顺序”。例如,给定一套电影评论数据,它可以知道“杰出(great)”电影的排名高于“好(good)”和“坏(bad)”电影。


AutoML 技术,算法学习到的语义顺序也可以用在癌症诊断分析,甚至是韩文文本分类等任务上,减少时间和计算。巴拉米说:“BERT 需要几个月的计算,而且非常昂贵,模型的生成和重复就要花上 100 万美元。


所以,如果每个人都想做同样的事情,它又是很昂贵、浪费的,那其实对世界并不友好。”尽管该领域展示出了希望,但研究人员仍在寻找使 AutoML 技术提高计算效率的方法。


例如,像神经架构搜索这样的方法,目前正在构建和测试许多不同的模型,以找到最佳拟合,而完成所有这些迭代所需的能源是不可小觑的。AutoML 技术也可以应用于不涉及神经网络的机器学习算法,比如创建随机决策森林或支持向量机来对数据进行分类。


这些领域的研究更加深入,许多编码库已经适用于那些想要将 AutoML 技术整合到项目中的人。会议组织者弗兰克·哈特(Frank Hutter)表示,下一步是使用 AutoML 来量化不确定性,并解决算法中的可信度和公平性问题。


在这一愿景中,围绕可信度和公平性的标准将类似于任何其他机器学习的限制,比如准确性。而 AutoML 可以在算法发布之前识别并自动纠正被发现的偏见。


探索仍在继续


但对于深度学习而言,AutoML 还有很长的路要走。用于训练深度学习模型的数据,如图像、文档和语音,通常是密集而复杂的。


它需要巨大的计算能力来处理。训练这些模型的成本和时间都令人望而却步,只有在财力雄厚的私人公司工作的研究人员才能从事。会议上的一个比赛要求参与者开发神经结构搜索的节能替代算法,这是一个相当大的挑战,因为这种技术有着极高的计算要求。


它会自动在无数个深度学习模型中循环,帮助研究人员为他们的应用选择正确的模型,但这个过程可能需要几个月,花费超过 100 万美元。这些被称为“零成本神经架构搜索代理”的替代算法的目标是,通过显著减少其计算程度,使神经架构搜索更容易访问和环保。


最终他们希望在几秒钟之内得到结果,而不是几个月。不过这些技术仍处于开发的早期阶段,通常是不可靠的,但机器学习研究人员预测,它们拥有很大潜力,能过让模型选择过程更高效。


支持:Ren


原文:

https://www.technologyreview.com/2022/08/05/1056814/automation-ai-machine-learning-automl/





Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/146927