Py学习  »  机器学习算法

谷歌大牛Jeff Dean撰文:深度学习研究的黄金十年|洞见

阿尔法公社 • 2 年前 • 101 次点击  

阿尔法公社

重度帮助创业者的天使投资基金

━━━━━━


阿尔法公社说:近日,谷歌AI掌门人Jeff Dean亲自撰文,探讨2010年代的十年时间里,促进深度学习快速发展的原因有哪些?他还对未来的 AI 发展做出了自己的展望。


自从计算机诞生之初,人类就梦想着能够创造出会思考的机器。1956年在达特茅斯学院组织的一个研讨会上,约翰 · 麦卡锡提出人工智能这个概念,一群数学家和科学家聚集在一起寻找如何让机器使用语言、形成抽象理解和概念、以解决现存的各种问题,当时研讨会参与者乐观地认为,在几个月的时间里这些问题能取得真正的进展。


人工智能是由约翰 · 麦卡锡于1956年在达特茅斯学院组织的一个研讨会上创立的,一群数学家和科学家聚集在一起寻找如何让机器使用语言、形成抽象和概念、解决现在保留的各种问题,当时研讨会参与者乐观地认为,几个月的集中努力将在这些问题上取得真正的进展。


1956年达特茅斯人工智能会议的参与者:马文 · 明斯基、克劳德 · 香农 、雷 · 所罗门诺夫和其他科学家。摄自:Margaret Minsky


事实证明,预留几个月的时间安排过于乐观。在接下来的50年里,创建人工智能系统的各种方法开始流行,但后来又遭遇过时,包括基于逻辑的系统、基于规则的专家系统和神经网络。


直到2011年左右,人工智能才开始进入发展关键阶段,取得了巨大的进步,这得益于深度学习中神经网络的复兴,这些技术的进步有助于提高计算机看、听和理解周围世界的能力,使得人工智能在科学以及人类探索的其他领域取得巨大进步。这其中有哪些原因呢?


近日,谷歌大牛Jeff Dean发表了一篇文章《A Golden Decade of Deep Learning: Computing Systems & Applications》,文章探索了深度学习在这黄金十年里,计算系统以及应用进步的原因都有哪些?本文重点关注三个方面:促成这一进步的计算硬件和软件系统;过去十年在机器学习领域一些令人兴奋的应用示例;如何创建更强大的机器学习系统,以真正实现创建智能机器的目标。以下收录Jeff Dean文章的全文中文版,enjoy。

深度学习的黄金十年1:人工智能硬件和软件的进步


人工智能的硬件和软件:深度学习通过组合不同的线性代数(例如矩阵乘法、向量点积以及类似操作)进行运算,但这种运算方式会受到限制,因此我们可以构建专用计算机或加速器芯片来进行处理,相比于通用CPU,这种专业化的加速器芯片能带来新的计算效率和设计选择。


专为支持此类计算而定制的计算机或加速器芯片。相对于必须运行更广泛种类的算法的通用CPU,这种专业化实现了新的效率和设计选择。


早在2000年代初期,就有少数研究者开始探索使用GPU来实现深度学习算法。之后到了2004年,计算机科学家Kyoung-Su Oh和Keechul Jung展示了使用GPU对神经网络算法近20倍的速度提升。2008年,计算机科学家Rajat Raina及其同事演示了在某些非监督学习算法中,使用GPU与使用基于CPU的最佳实现相比,GPU速度提升可达72.6倍。


随着计算硬件的改进,深度学习开始在图像识别、语音识别、语言理解等方面取得显著进步。深度学习算法有两个非常好的特性可以构建专门的硬件:首先,它们对精度的降低非常宽容;其次,深度学习的计算方式,其由密集矩阵或向量上的不同线性代数运算序列组成。


为了使深度学习和计算变得更容易,研究人员开发了开源软件框架,如今,开源框架帮助大量的研究人员、工程师等推进深度学习研究,并将深度学习应用到更广泛的领域。


早期的一些框架包括Torch、Theano、DistBelief 、Caffe等,还有谷歌在2015年开发、开源的TensorFlow,它是一个允许表达机器学习计算的框架,并结合了Theano和DistBelief等早期框架的想法。到目前为止,TensorFlow已被下载超过5000万次,是世界上最受欢迎的开源软件包之一。


TensorFlow发布的一年后,PyTorch于2016年发布,它使用Python可以轻松表达各种研究思想而受到研究人员的欢迎。JAX于2018年发布,这是一个流行的面向Python的开源库,结合了复杂的自动微分和底层XLA编译器,TensorFlow也使用它来有效地将机器学习计算映射到各种不同类型的硬件上。


TensorFlow和PyTorch等开源机器学习库和工具的重要性怎么强调都不为过,它们允许研究人员可以快速尝试想法。随着世界各地的研究人员和工程师更轻松地在彼此的工作基础上进行构建,整个领域的进展速度将加快!


深度学习的黄金十年2:研究成果激增


研究不断取得进步、面向ML硬件(GPU、TPU等)的计算能力不断增强、开源机器学习工具(Tensor­Flow、PyTorch等)被广泛采用,这一系列进展使得机器学习及其应用领域的研究成果急剧增加。其中一个强有力的指标是发布到arXiv上关于机器学习领域的论文数量,arXiv是一个广受欢迎的论文预印本托管服务,2018年发布的论文预印本数量是2009年的32倍以上(每两年增长一倍以上)。通过与气候科学和医疗保健等关键领域的专家合作,机器学习研究人员正在帮助解决对社会有益、促进人类进步的重要问题。可以说我们生活在一个激动人心的时代。


深度学习的黄金十年3:科学和工程应用激增


计算能力的变革性增长、机器学习软硬件的进步以及机器学习研究成果的激增,都使得机器学习应用在科学和工程领域的激增。通过与气候科学和医疗健康等关键领域的合作,机器学习研究人员正在帮助解决对社会有益并促进人类发展的重要问题。这些科学和工程领域包括如下:


  • 神经科学
  • 分子生物学
  • 医疗健康
  • 天气、环境和气候挑战
  • 机器人
  • 可访问性
  • 个性化学习
  • 计算机辅助的创造性
  • 重要的构建块
  • Transformers
  • 计算机系统的 ML

每个细分的详细内容请参考原文。

深度学习的黄金十4:机器学习的未来

ML研究社区正在出现一些有趣的研究方向,如果将它们结合起来可能会更加有趣。

首先,研究稀疏激活模型,比如稀疏门控专家混合模型(Sparsely-Gated MoE),展示了如何构建非常大容量的模型,其中对于任何给定的实例(如 2048 个专家中的两至三个),只有一部分模型被「激活」。

其次,研究自动化机器学习(AutoML),其中神经架构搜索(NAS)或进化架构搜索(EAS)等技术可以自动学习ML模型或组件的高效结构或其他方面以对给定任务的准确率进行优化。AutoML通常涉及运行很多自动化实验,每个实验都可能包含巨量计算。

最后,以几个到几十个相关任务的适当规模进行多任务训练,或者从针对相关任务的大量数据训练的模型中迁移学习然后针对新任务在少量数据上进行微调,这些方式已被证明在解决各类问题时都非常有效。

一个非常有趣的研究方向是把以上三个趋势结合起来,其中在大规模ML加速器硬件上运行一个系统。目标是训练一个可以执行数千乃至数百个任务的单一模型。这种模型可能由很多不同结构的组件组成,实例(example)之间的数据流在逐实例的基础上是相对动态的。模型可能会使用稀疏门控专家混合和学习路由等技术以生成一个非常大容量的模型,但其中一个任务或实例仅稀疏激活系统中总组件的一小部分。

下图1描述了一个多任务、稀疏激活的机器学习模型。


每个组件本身可能正在运行一些类AutoML的架构搜索,以使组件的结构适应路由到它的数据类型。新的任务可以利用在其他任务上训练的组件,只要它有用就行。Jeff Dean希望通过非常大规模的多任务学习、共享组件和学习路由,模型可以迅速地以高准确率来完成新任务,即使每个新任务的新实例相对较少。原因在于模型能够利用它在完成其他相关任务时已经获得的专业知识和内部表示。

构建一个能够处理数百万任务并学习自动完成新任务的单一机器学习是人工智能和计算机系统工程领域真正面临的巨大挑战。这需要机器学习算法、负责任的 AI(如公平性和可解释性)、分布式系统和计算机架构等很多领域的专业知识,从而通过构建一个能够泛化以在机器学习所有应用领域中独立解决新任务的系统,来推动人工智能领域的发展。

深度学习的黄金十年5:负责任的AI开发

虽然AI有能力在人们日常生活的方方面面提供帮助,但所有研究人员和从业人员应确保以负责任的方式开发相关方法,仔细审查偏见、公平性、隐私问题以及其他关于 AI 工具如何运作并影响他人的社会因素,并努力以适当的方式解决所有这些问题。

制定一套明确的原则来指导负责任的AI发展也很重要。2018年,谷歌发布了一套AI准则,用于指导企业与AI相关的工作和使用。这套AI准则列出了需要考虑的重要领域,包括机器学习系统中的偏见、安全、公平、问责、透明性和隐私。近年来,其他机构和政府也纷纷效仿这一模式,发布了自己的AI使用准则。Jeff Dean希望这种趋势能够延续下去,直到它不再是一种趋势,而成为所有机器学习研究和开发中遵循的标准。

Jeff Dean对未来的展望

2010年代的确是深度学习研究和取得进展的黄金十年。1956年达特茅斯人工智能研讨会上提出的一些最困难的问题在这十年取得了长足进步。机器能够以早期研究人员希望的方式看到、听到和理解语言。核心领域的成功促使很多科学领域迎来重大进展,不仅智能手机更加智能,而且随着人们继续创建更复杂、更强大且对日常生活有帮助的深度学习模型,未来有了更多的可能性。得益于强大机器学习系统提供的帮助,人们将在未来变得更有创造力和拥有更强的能力。

原文链接:https://www.amacad.org/publication/golden-decade-deep-learning-computing-systems-applications

本文转载自机器之心,原作者Jeff Dean,由机器之心编译。


更多精彩文章:

行猩科技:物流的终极模式是无人电动运力网络|阿尔法Family


阿尔法公社蒋亚萌上榜2021“福布斯中国创投人100”


关于阿尔法公社
阿尔法公社(Alpha Startup Fund)是中国领先的早期投资基金,由曾带领公司在纳斯达克上市的许四清和前创新工场联合管理合伙人蒋亚萌在2015年共同创立。

阿尔法公社基金的三大特点是系统化投资、社交化创业者社区运营和重度产业资源加速成长。专注在半导体、企业服务软件、人工智能应用、物联网技术、金融科技等科技创新领域进行早期投资。目前已经在天使轮投资了包括白山云科技、领创集团(Advance Intelligence Group)、Zenlayer、帷幄科技、所思科技等为数众多的优秀项目。

阿尔法公社获得36氪“2017年度最受创业者欢迎天使投资机构Top20”、“2019年中国企业服务领域最受LP欢迎早期投资机构”、“2019年中国企业服务领域最具发现力投资机构TOP10”以及“2020中国最受创业者欢迎早期投资机构TOP50”、“2021年度中国最受LP认可早期投资机构TOP30”、“2021年中国最受创业者欢迎早期机构TOP50”、“2021年中国跨境出海领域投资机构TOP10”等奖项;获得钛媒体“2020 EDGE TOP50投资机构”;还获得母基金研究中心“2018年中国早期基金最佳回报TOP30”、“2019中国早期基金最佳回报TOP30”,以及母基金周刊“2020中国投资机构软实力GP100科技力Top10”等奖项。


创始合伙人许四清获得2020年“福布斯中国创投人100”、投中“2019年中国最佳早期投资人TOP50”,以及36氪“2018年中国企业服务领域投资人TOP10”、“2019企业服务领域投资人TOP20”等奖项。创始合伙人蒋亚萌获得2019及2021年“福布斯中国创投人100”、36氪“2019年中国中生代投资人TOP50”大奖。


BP请投递到:bp@alphastartups.net,7 天内快速收到回复,直接约见资深合伙人。

无需BP就可申请投资,详情请点击阅读原文
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/132428
 
101 次点击