Py学习  »  机器学习算法

推动机器学习工业化,AI成为新时代的基础设施

DataFunTalk • 1 年前 • 166 次点击  
导读
2022年世界人工智能大会已经于9月1日-3日在上海召开, 本届大会继续秉持“智联世界”的理念,通过线上线下联动的会展形式,推动行业共同发展。亚马逊云科技以线上论坛的方式参会,带来“人工智能的前沿技术趋势与最佳实践”为主题的论坛,邀请亚马逊云科技全球演讲者,聚焦亚马逊云科技在人工智能领域的最新研究以及技术产品落地实践,以及如何利用人工智能前沿技术帮助企业构筑业务增长和企业创新的新引擎。
论坛内容设计紧扣“人工智能前沿技术趋势与最佳实践”的主题,同时呼应WAIC“智联世界,元生无界”的主题,结合AI产业界和学术界的热点话题与热门趋势,诚邀亚马逊云科技全球人工智能领域科学家,产品专家,高级学者以及产业界的行业投资领袖和产业实践先锋,通过1个主题演讲、6个技术领导力分享、1个圆桌论坛的形式,全面展示了亚马逊云科技在人工智能与机器学习领域的行业积累和技术领导力。

在亚马逊云科技看来,机器学习正走向全方位的工业化,并将成为所有组织创新的基础设施。因此,我们需要不断推进机器学习技术的标准化,优化基础软件、硬件技术,以云原生技术为支撑,建立机器学习全球生态,同时兼顾安全风险的规避,让机器学习推动企业创新成为新时代的常态。

01 机器学习走向工业化

首先,亚马逊云科技人工智能与机器学习产品副总裁 Bratin Saha 博士带来了“人工智能与机器学习如何加速创新”的主题演讲。Bratin 博士分享了亚马逊云科技眼中的机器学习前沿技术,以及这些技术如何帮助客户使从他们的数据中获得更深入的见解、做出更准确的预测、减少运营开销、改善客户体验,并创建全新的业务线,助力企业成为数据驱动的组织。


如今,数据驱动的公司数量每年都以超过 30% 的速度增长,但许多组织仍然无法让数据发挥作用。只有 28% 的公司拥有可以利用的基于数据战略跟踪站点的数据。


基于全方位的云平台工具,提供最广泛的选择和数据存储分析和机器学习服务,这是构建现代数据策略的必要支撑。相比之下,对于仍在运行主数据库或云原生数据库的企业而言,他们仍然需要处理许多无差别的繁重工作,例如配置批处理备份、数据库和数据库管理箱等等。


此外,现代数据策略还能让你统一管理数据资产,对所有数据实现数据分析和数据治理。


如今异构数据集成和管理是最具变革性的技术之一,我们需要能同时管理关系型数据库和非关系型数据库。通过数据迁移、交互式查询和机器学习服务,企业得以实现现代数据策略。


当下企业之所以对机器学习重点并持续投入,是因为它能够解决重要的经济和社会问题。而这些投资已经带来了显而易见的效果。


机器学习在不断地推动着企业创新,比如将在线语音和视频自动转录为字幕、个性化的推荐系统等,特别是,将机器学习应用于源于系统传感器和设备的数据,可能会改变工业制造领域的游戏规则。


机器学习使企业能够从音频、视频、医学数据、城市数据等所有类型、非结构化、多模态的数据中提取洞察,并解决以前无法单独使用软件分析和大数据解决的问题,让世界变得更智能、更安全、更健康。毫无疑问,机器学习将以我们无法想象的方式推动前沿发展。


而让机器学习助力企业创新的关键驱动力,就是工业化机器学习。过去的软件领域也是如此,从专业的业务应用到日常应用,都是基于自动化执行和标准化流程实现的,实际上这就是软件的工业化。


为此,我们必须拥有可低成本构建的基础架构。其次是机器学习专用工具,比如机器学习开发环境、文件管理器等。然后我们需要将其集成到云服务中。


机器学习工业化能够自然地推动企业员工的创造力。如今人工智能和机器学习专家的年增长率非常高,机器学习教育也在飞速发展,但这仅仅是开始。


接下来,由四位来自亚马逊云科技不同领域的专家分别承接Bratin博士的主题演讲,深入浅出地分享了亚马逊云科技在人工智能自研训练和推理芯片、图神经网络、自动化机器学习以及“负责任的人工智能”等几个方面的最新研究和产业化进展。


人工智能芯片的研究与开发一直是国内学术界和产业界的热点话题,鉴于此,亚马逊云科技机器学习加速芯片Inferentia和 Trainium 的首席架构师 Ron Diamant分享了亚马逊云科技Inferentia 和 Trainium的专用机器学习加速芯片的架构及设计理念,以及它们如何帮助机器学习从业者能够在各种机器学习工作负载中实现低延迟、高性价比的人工智能推理与训练,以期为各芯片产业界同行提供启发与借鉴。

机器学习正变得越来越复杂和昂贵,顺应这一趋势,基于大型芯片缓存、快速互连等技术,我们能够将模型部署到更大规模的虚拟设备中,同时支持所有主流的机器学习框架和数据类型,并且无需关心数据转换、模型调整、模型量化等细节,就能实现降本增效。


亚马逊云科技上海人工智能研究院院长、资深首席科学家、图计算的开源项目 Deep Graph Library (DGL) 的开发负责人张峥教授带领听众探讨了图神经网络(GNN)在自然语言处理中应用实践,分享了如何借助图神经网络实现更准确高效的文本内容分析。

深度学习或机器学习的一个基本假设是数据的独立同分布假设,但在现实世界中并非如此,因此我们想到了图方法。如果考虑数据之间的联系,就可以开辟很多新的研究方向。这意味着我们不仅要考虑输入到输出的函数,也要考虑输入之间的联系。


亚马逊云科技人工智能开源项目首席产品经理、开源AutoML 框架AutoGluon的开发负责人叶文铭分享了自动化机器学习框架AutoGluon 如何在 5 分钟内通过 3 行代码彻底改变机器学习工作流程,助力开发者轻松构建超大规模的机器学习应用。

我们是在更高的抽象层次上、在所有其它框架之上构建了AutoGluon,其核心技术是堆栈集成。这彻底改变了人们使用机器学习的方式,是机器学习工业化的重要一步。甚至可以说,只需要3行代码,你就能击败99%的数据科学家。并且,当你从PyTorch等框架进行创新工作时,我们也能立即为你生成3行代码的AutoGluon版本。后续,我们将努力将该框架接入其它生态系统。


最后, 作为“负责任的人工智能”理念的倡导者和实践者,我们特意邀请到了Amazon Scholar、宾夕法尼亚大学计算机与信息科学系教授Michael Kearns 分享了亚马逊云科技在“负责任的人工智能”领域关于算法公平、隐私、鲁棒性及算法透明度等方面的关注重点,以及探讨关于如何在整个组织中实施“负责任的人工智能”所需的工具、指导和资源。
为什么简单地优化最准确或最具预测性的模型不会自动给我们实现公平性、隐私性、可解释性等属性呢?优化准确性时,不能只是祈祷通常的训练方法会自动赋予模型这些社会属性。我们需要在训练工作流程中采取明确的行动,以确保这些属性存在,因此需要对训练的模型进行全方位的审计。所以,更普遍的原则是,机器学习不会免费给你任何没有明确要求的属性,也不会避免任何没有明确定义如何避免的行为。
02 AI赋能行业创新
AI与行业相结合,才能真正发挥出技术的价值。鉴于COVID-19全球大流行,如何使用人工智能技术助力医疗健康与生命科学领域的研究也越来越受科学家们的重视。亚马逊云科技机器学习总监兼首席医疗官Taha Kass-Hout博士分享了医疗健康与生命科学领域中的机器学习普惠化,重点介绍了如何采用亚马逊云科技的人工智能和机器学习服务帮助解决健康数据的不完整性、不一致性和非结构化,以实现更好的数据管理和分析,带来更好的见解,从而做出更明智的决策。
在过去的10年里,癌症患者的个性化治疗选择增加了4倍。今天,患者收集的数据比以往任何时候都多。我们可以利用所有的数据,来提供高度个性化的服务。围绕如何共享和结构化这些数据,出现了新兴的互操作性标准。数据的非结构化性是一大挑战,而将数据标准化、结构化之后,就可以利用标准化云计算来转化数据的价值。


元宇宙也被视为下一个风口,围绕今年大会“智联世界、元生无界”的主题,充分展现AI新技术与元宇宙“新赛道”的融合碰撞,探索元宇宙与游戏创新应用的实践 ,亚马逊云科技游戏行业解决方案架构负责人张孝峰分享了如何借助Epic Unreal引擎和亚马逊Ambit构建一套用于大规模简化三维内容创建的工具,用于在自动驾驶仿真、机器人仿真和其他实时三维应用程序仿真中创建高质量的虚拟世界。
今天的游戏引擎已经是一个非常庞大的开发平台,而且这个开发平台并不是由虚幻一家去做出来。实际上它是一个非常庞大的生态系统,里面包含了渲染引擎、物理引擎、声音脚本等各种功能。人工智能可以帮助我们减少大量的重复劳动,游戏引擎也在朝这个方向发展,不断地降低使用门槛。


论坛最后,GGV纪源资本合伙人吴陈尧,中科创达执行总裁邹鹏程和亚马逊云科技产品总监张洋一道,以圆桌论坛的形式,共话人工智能在产业领域的落地机遇与挑战,畅谈人工智能如何赋能行业创新, 推动企业转型与产业创新。 

所有新生技术终将变成日常应用,就像我们今天已经不再惊奇于高清视频、在线支付一样,随着机器学习技术不断成熟落地,AI创新创业也会在未来变成所有企业的标配,亚马逊云科技也将在实现这一局面的征程上引领整个行业。

扫描二维码即可申请亚马逊云科技免费套餐

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/147304
 
166 次点击