
WTM IWD 2019 合影
WTM IWD 2019 女性开发者大会于 4 月 21 日落下帷幕(活动回顾),那些满满的干货,将会在接下来的几天,与您一一呈现 —— 我们精心整理了嘉宾演讲原文。
感谢志愿者的校对和编辑!比心!❤️
前期回顾:
这一篇,我们将为大家带来 Google 机器学习工程师孙璐的主题演讲《TensorFlow 的最新进展》。
嘉宾介绍

孙璐毕业于 University of Illinois Urbana-Champaign,获得工程硕士学位。2013年加入谷歌总部,研发用于谷歌展示广告系统的机器学习模型,以提高终端用户体验。2016年加入谷歌上海,负责领导商业智能体系中的机器学习项目,以及谷歌上海人工智能相关的项目和活动。
开场白
大家下午好,我叫孙璐,我是 Google 的一名机器学习工程师,今天非常荣幸来到这里和大家分享 Google 的人工智能技术以及 TensorFlow 最新的一些进展。

人工智能领域突破的三大原因
我们正在经历着一场前所未有的革命,由于人工智能领域的突破,人们与计算机系统交互的方式发生了本质上的变化,主要是由三个因素推动的:
首先,现在有了更多的计算资源,包括专门设计的深度神经网络运算加速器,例如 TPU 以及 TPU 的集群,让我们以前所未有的速度运转我们的神经网络模型。
其次,在机器学习的算法方面也有了大量的突破和进步。如果你关注这方面的新闻,可以经常看到关于机器学习算法研究的报道,例如 Bert,这是一种自然语言处理的创新方法。Google 几个月前公开了算法的细节源代码,以及在海量的数据上进行过预训练的模型,它可以让世界上任何人训练他们自己最先进的自然语言处理系统,比如问答系统。
最后是大量的数据,来自各种学科的大量的数据集,包括图片、文字、语音、医疗健康、材料科学等领域。例如 Google 最新开放的 Open Images Extended 的数据集,这个数据集有将近 50 万张标注过的图片,是通过众筹的方式以及全球志愿者的努力,大大提高了数据集的包容性和全球多样性。
这三点都在帮助我们以更有效的方式来解决有挑战性的现实问题。
“Bring the benefit of AI to everyone”
Google 的使命是组织世界的信息,使其普遍可用和有用。AI 正以激动人心的新方式帮助我们做到这一点,为用户、客户和全世界解决问题。Google 的人工智能让人们在日常生活工作变得更加方便,帮助其他企业进行创新,并且让我们重新思考各种社会问题,帮助我们推进科学的发展。
在 Google 的内部,我们将 TensorFlow 使用在很多核心的产品上,例如 Google Photos,可以给照片进行整理打标签,方便你更快的找到亲人朋友的照片。

Gmail 也是 Google 的一个核心的产品,其智能推荐系统能够更快捷地去编写电子邮件。这个在我工作当中是经常用到的,尤其是对于简短的回复,经常就是两个 Click 就回复了一个邮件。

Google Translate 和计算机视觉结合在一起,就创造了一个更方便的帮助人们跨越语言障碍的一个小 APP。
猜画小歌 是在微信上面的一个微信上面的一个应用小程序,是我们上海的工程师开发的。用人工智能的技术理解用户的画技,并且陪你玩这样好玩的游戏。

Waymo 是大概十年前 Google 开启的一项 自动驾驶汽车计划,大概在 16 年底的时候分离成为 Alphabet 旗下的一个子公司,他使用了人工智能的很多技术,用照相机雷达感应器和激光测距仪结合人工智能的技术,包括计算机视觉的技术来判断周边的交通状况,发出驾车指令,并且使用详细的地图来导航,使车辆能够更有效地对周边的环境作出反应。

TensorFlow 除了在 Google 内部 power 了很多核心的产品外,也帮助一些企业合作方制作并提高他们的产品和服务。例如腾讯广告使用了基于 TensorFlow 大规模深度学习的一个系统来应用到他们很多的产品当中,主要在广告方面,会对点击率转化率进行预测,以及智能定向等等。

同时美团和大众点评也是 TensorFlow 的高级用户,他们在产品推荐和架构方面都使用了 TensorFlow 技术。

在节约能源方面,Deepmind 做出了一些有意义的创新,Deepmind 就是研发 AlphaGo Zero 人工智能下围棋的公司,也是 Google 的母公司 Alphabet 的旗下的一家以人工智能科研为主的公司。Google 有非常多的数据中心遍布世界各地,同时这些计算机以及存放这些计算机的建筑也消耗了大量的能源。Deepmind 的学者们开发了一个机器学习模型,优化数据中心的用于制冷的能源使用效率。当人工智能推荐打开时,PUE 直迅速降低,数据显示这套机器学习系统使得该数据中心用于制冷的能源减少了 40%。这相当于在考虑到电器损耗和其他低效的智能系统之后,总体的 PUE 开销减少了 15%,是个非常令人激动的创新。

“TensorFlow 帮助应对可持续发展面临的诸多问题”
在亚马逊保护热带雨林
在非洲帮助当地的农民种植
在印度预测洪水来袭的威胁

Google 的人工智能技术携手 TensorFlow,帮助应对可持续发展面临的诸多问题,例如保护亚马逊的热带雨林,有人工智能爱好者兼环保人士,开发出一套机器学习的系统,来检测森林当中伐木的声音,用以阻止乱砍滥伐。有人致力于用人工智能的方式检测农田里的害虫,以帮助非洲的农民。

在医疗健康领域,人工智能还带来了前所未有的新机遇,一个计算机视觉技术检测糖尿病性视网膜病变的例子。全球有 4 亿人受到这种病的威胁,如果发现得早,其实非常容易医治,用非常便宜的药物就可以治好。但是如果发现的晚的话,就会导致病人失明。在人工智能的帮助下,病人可以通过机器高效和便捷的方式发现这种疾病。
当我们仰望星空可以看到,除了少数极少数发着微光的恒星之外,绝大部分的宇宙空间都是非常的黑暗阴冷的,通过人类人力的方式去分析海量的天文学数据基本上是不可能的,这时候人工智能就开始发挥了积极的作用。大家知道,一年多以前,通过开普勒空间望远镜收集的数据,发现了开普勒 90 的第八颗行星,这颗行星叫开普勒 90A,它是质量是地球的 1.32 倍,可以说是一个超级地球,它的加入使得开普勒 90 成为又一个拥有八颗行星的太阳系外恒星。
Google 的人工智能七大原则
我想大家都感受到了我们正在经历了一个机器学习的革命,它给我们带来了前所未有的机遇和挑战,那么我们怎么才能够抓住这些机遇迎接这次挑战,并且顺利开始第四次工业革命,并且规避它所有可能带来的风险呢。

Google 去年提出了人工智能的七大原则,倡导大家在开发人工智能产品时以人为本兼顾平等,保护隐私以及坚持科学的标准,这也是 Google 发展人工智能的核心。
除了遵循一定的开发原则,我们还需要一个强大便捷的开发平台。TensorFlow 正是这一机器学习的平台。TensorFlow 功能非常强大,算法包容性强,不仅适用于企业级的产品开发,而且适用于学者们的科研创新。
TensorFlow 在 Google 内部的产品上发挥了不可或缺的非常重要的作用,而且在 Google 的一些企业级的合作伙伴上,刚才我们也看到有腾讯有美团和大众点评,这里是 Twitter 的一个例子,Twitter 需要及时推荐用户可能感兴趣的 tweet,但是由于用户量巨大,这个推荐系统的挑战是可想而知的。于是推特研发出了一个基于 TensorFlow 的推荐系统,叫做 Ranked Timeline。通过使用 TensorFlow 生态系统的比如 TensorFlow Hub, TensorFlow Extended, TensorFlow model 这些工具,大大减少了它的模型训练和迭代的时间。
TensorFlow 的科研支持
除此之外,TensorFlow 也为前沿的科研提供了支持。美国的国家能源研究与科学计算中心和 Oak Ridge 国家实验室以及 Nvidia 的科学家研究人员和工程团队,使用高性能计算机和基于 TensorFlow 的深度神经网络来研究极端天气以及它们对地球的影响。他们搭建的这个深度神经网络模型,在世界上最快的超级计算机 Summit 上运行,实现了相当于每秒钟 10 的 18 次方以上的运算速度。因此他们获得了 Gordon Bell Prize,这是超算领域一个非常重量级的奖项。

自从 Google 在 2015 年底开源了 TensorFlow,已有超过 4100 万次的下载,并在全球拥有超过 1800 名的贡献者。在 TensorFlow 社区的帮助下,TensorFlow 已经成为世界上最广泛使用的机器学习框架。这里 Github 上的最新地图显示, TensorFlow 的爱好者已经遍布世界各地,在中国也有着广泛的分布。去年 11 月是 TensorFlow 开源三周年,上个月我们发布了 TensorFlow 2.0,这三年多以来,TensorFlow 从一个孤立的机器学习平台发展到 TensorFLow 2.0 成为一个端到端的生态系统,这标志着新时代的开始。
TensorFlow 2.0 的到来
TensorFlow 2.0 解决了广受开发者们关注的几个问题,
API 的整合,TensorFlow 2.0 主推 Keras API 并将其与Eager Execution 相结合,以简化 python 的代码。
TensorFlow 2.0 非常强大,可以支持最前沿的计算集群,进行最复杂的模型运算。
TensorFlow 2.0 在 Google 的众多产品上,经过实战实战的测试,可以放心部署到任何产品系统中。
“Usability”
在可用性方面,Keras 是 TensorFlow 的高级 API,提供了构造模型和部署模型的一整套的工具。为了让开发者更高效的工作,我们更进一步扩展 Keras,开发者可以直接从 Keras 访问 TensorFlow 的所有高级功能。TensorFlow 2.0 的另一个重大的变化是切换到 Eager Execution上,不需要构造完整的模型架构,任意一个 Tensor 运算都可以马上执行。如果对两个数字做加法,现在可以立刻看到结果。同时仍可以获得老版本的所有其他功能,包括模型序列化模型部署模型,优化分布式计算和与不同系统的兼容性。

“Clarity”
TensorFlow 2.0 是一个里程碑式的版本,我们借此机会进行了大量的 API 整理。TensorFlow 有很多重复的,甚至会略有不同的功能,非常令人困惑,这是 TensorFlow 入门的一大壁垒。在 TensorFlow 2.0 中,我们重新组织并整合了 API,确保 API 看起来和感觉上是一致的。TensorFlow 目前已发展成为一个庞大的工具和产品生态系统,我们也花了很多精力来调整各种接口,确保其可以顺利地部署到任何一个产品的运行环境中。

“Flexibility”
经过各种整理和整合,TensorFlow 2.0 拥有了一套完整的 API,包括高级的 Keras API 和低级的单元运算 API,这就意味着你甚至可以对 raw_ops 直接进行操作,具有高度的灵活性。我们还为一些常用的部件,例如 variables,checkpoints,layers 提供可继承的接口,这样开发者可以在 TensorFlow 之上构建自己的机器学习框架,同时保持与 TensorFlow 生态系统里其它部件的兼容性。

“Making upgrading easy”
为了让 TensorFlow 的升级到 2.0 变得更容易,我们准备了一些工具。作为 TensorFlow 2.0 的一部分,我们将发布一个兼容性模块 tf_compat_v1 其支持所有的 API,已有的 TensorFlow 代码也会正常运行。大家可能知道 tf.contrib 会被废弃掉,但是我们已经准备好了替代方案,我们还发布了一个脚本 tf_upgrade_v2 可以将 TensorFlow 程序转换为 2.0 的版本。

“Deploy anywhere”
训练好的模型最终都要部署到应用场景当中去,模型部署一直都是 TensorFlow 的核心优势,支持服务器和云端移动设备和其他的边缘设备,浏览器和 JavaScript 平台,对应于 TensorFlow 的生态系统,分别是 TensorFlow Extended,TensorFlow Lite,TensorFlow JS。



我们在中国的合作伙伴爱奇艺将 TensorFlow Lite 用于各种移动端的应用,包括预测文本生成、视频分割和边缘检测。

TensorFlow Lite 最关注的是运算速度。自从去年推出 TensorFlow Lite 以来,我们一直在不断的改进以提高性能,不管是在 CPU、GPU,还是在 Edge TPU 上面,在 CPU 上面我们使用了最新的量化技术,在 GPU 上我们增加了对 Open GL3.1 的支持。在 Edge TPU 上我们不断优化性能得到了 62 倍的速度提升。这方面的工作还在进行当中,未来的一年我们会看到更快的速度。

目前全球已经有超过 20 亿台移动设备在运行 TensorFlow lite。


从那时候开始,我们看到了在 JavaScript 社区的大量采用有超过 30 万的下载和一百个代码贡献者。那如果考虑到 JavaScript 和外部生态系统的规模,这才只是刚刚开始。在上个月的开发者峰会上,我们正式发布了 TensorFlow.js v1.0 的版本,这比之前的版本有了许多改进和新功能。对常见的机器学习问题,比如图像文本及音频的处理,有一个现成的模型库,叫 Off-the-shelf models,可以直接在浏览器和服务器中运行这样的模型。我们还要增加更多的 TensorFlow JS 运行 Platform 平台的支持,比如 Electron 桌面应用程序和各种原生的移动平台。当然 TensorFlow JS 另外一个重点就是 Performance 性能改进,以 Mobilenet V1 为例,Mobilenet 是一个为移动端定制的图像分类模型,图表显示了 Mobilenet 在 Chrome 浏览器中的运算性能。在带有离散显卡的笔记本电脑上,Macbook Pro 上面 Mobilenet 的运算时间达到了 15 毫秒。在 Google 和 HTC 合作开发的 Pixel 2 手机上,只有 150 毫秒左右,在 iOS 设备上,运算速度更是加快了 9 倍,降到了 30 毫秒之内。
学习TensorFlow的那些事
今天这些内容都可以在重新设计过的 TensorFlow 网站上找到,在网站上可以看到更多的实例文档和工具。我们还特别准备了方便中国开发者访问的镜像的网站:tensorflow.google.cn。
为了帮助更多开发者们学习 TensorFlow,我们推出了两门在线课程,都是新推出的。一门是和 Deeplearning.ai 合作的《Introduction to TensorFlow for AI, ML and DL》发布在 Coursera 上面。另外一个是 Udacity 平台上的《Introduction of TensorFlow for deep learning》。后面这个课程可以在中国访问到,非常推荐大家去学习。
最后敬请大家关注 TensorFlow 的微信公众号,可以看到 TensorFlow 的教程,实战案例以及活动的通知。我今天分享的内容主要来自于上个月的 TensorFlow 开发者峰会,大家可以在 Youtube 以及国内的很多视频网站上找到相关的更详细的内容,谢谢大家。
Q&A
观众(简化版问题):孙老师你好,我想请问对于数据在人工智能方面的使用涉及到的社会问题,例如一些银行数据因某些原因无法公开等,Google 是如何看待的?区块链技术 Google 现在有没有在使用?机器学习这个技术与人的经验到底有怎样的一个区别?人类的能力是否会被机器取代?
Sun Lu:好,我先回答第二个。机器学习和人脑。我一直相信机器学习是对人的一种辅助功能,它可以做我们觉得很无聊的事情,它可以帮我们把某些事情做得更快,在这些方面机器肯定是比人脑更加先进的。说到人脑的复杂程度,能不能用机器去模拟,并不是所有的情况都可以让机器比人脑更加优越,但是在有些特定的 task 上面,比如说人脸识别,其实机器就已经超过了人类。当你去机场去高铁站看到人脸识别真的部署到产品当中去,他检测的效率比人效率更高,因为它速度快,且更精准。
另外一个,数据,Google 的数据是非常多的,作为一个搜索引擎公司,它有世界上所有互联网上只要是开放的、可以给爬虫去扒的那些数据,所以这也是 Google 的人工智能发展比较迅速的关键原因。Google 其实是一个非常开放的公司,你们看到 TensorFlow 其实是 Google 花了很大力气开发出来的,但是一开发出来马上就开源,给大家用了。
另外像我今天也讲过的,Google 刚刚开源的一个叫做 Open Image Extended 的一个图像数据集,里面有将近 50 万张标注的图片,都开放给大家使用。所以在这个方面,google 是不光作为人工智能这个研究的引领者,同时也希望能够把所有的研究都汇集给全球的人。其实除了 TensorFlow,还有其他例如 Cloud AI 也是通过 Cloud AI 把 Google 的人工智能的技术分享给大学和企业。
还有问那个传统行业这部分数据的获取,每个行业都有自己关于数据方面的保护,像之前 Google 的那个七大 AI 原则也提到了,要保护隐私,保护数据的安全。其实对那些行业的数据来说,像银行的数据绝对是要非常保密,他不可能分享给大家去做模型的,这个是可以理解的。
🎙️预告:GDG 公众号将在近期不断推送 WTM 2019 的嘉宾演讲实录,请保持关注哦!


Google Developer Groups 谷歌开发者社区,是谷歌开发者部门发起的全球项目,面向对 Google 和开源技术感兴趣的人群而存在的公益性开发者社区。GDG Shanghai 创立于 2009 年,是全球 GDG 社区中最活跃和知名的技术社区之一,每年举办 30 – 50 场大大小小的科技活动,每年影响十几万以上海为中心辐射长三角地带的开发者及科技从业人员。
社区中的各位组织者均是来自各个行业有着本职工作的互联网从业者,我们需要更多新鲜血液的加入!如果你对谷歌技术感兴趣,业余时间可调配,认同社区的价值观,愿意为社区做出贡献,欢迎加入我们成为社区志愿者!
加入方式:关注上海 GDG 微信公众号:GDG_Shanghai,并回复:志愿者。