Py学习  »  机器学习算法

四个维度看深度学习平台飞桨如何成为人工智能的基础设施

小田记事本 • 4 年前 • 120 次点击  

公众号“小田记事本”(xiaotianbook)是财经专栏作家向小田的自媒体,关注产业金融、资本市场、互联网科技、VC/PE等领域。


(百度飞桨应用落地案例集锦)


飞桨在四个维度上的优势,正是中国AI产业的机会。

文 | 向小田


提到人工智能,几乎所有人都能做到一知半解,毕竟,这项并不算新的技术已经渗透到我们生产生活的方方面面,而作为计算机科学的一个重要分支,人工智能背后自然少不了底层的基础技术支撑,这其中,深度学习给出了实现人工智能的路径,让非生物体有了思考和学习的方法,成为了推动人工智能发展的最大功臣。这也使得无数开发者趋之若鹜,而有开发者的地方,自然有江湖,在115日的“WAVE SUMMIT+”2019深度学习开发者秋季峰会上我见证了一场属于深度学习开发者的狂欢。



值得一提的是,今年上半年,WAVE SUMMIT已经举办了一次,当时现场来了许多来自百度、华为、英特尔、清华大学等产业界、学术界的专家学者和近千名深度学习开发者,场面十分热闹,也说明了深度学习正在掀起一个热潮,越来越多的人开始关心甚至参与到这个行业中来,行业的价值正在凸显。如今间隔不久,就又召开了一次,可见行业的发展真的是一日千里,行业又有了很多新的进展和升级。


这次峰会上,最为值得注意的是,刚刚在乌镇世界互联网大会上获得世界互联网领先科技成果的百度深度学习平台飞桨(PaddlePaddle),全新升级和发布了21个产品方向。这次发布的特性和服务比上次春季峰会多出接近一倍。这些新的产品方向包括面向产业应用场景的四大产业级开发套件、融合数据和知识的预训练结合迁移学习的飞桨Master模式、端侧推理引擎Paddle Lite 2.0EasyDL专业版、前沿技术工具组件等等。可以看到飞桨的易用性在全面提升,越来越好用,门槛越来越低,服务能力越来越强。飞桨正在成为开发者进入AI时代的水电煤气。基础设施铺好之后,产业智能化的新工业革命就要加速展开了。


为什么说飞桨的进步会加速AI在中国前进的步伐呢?这就要首先理解飞桨的意义所在。飞桨作为国内领先的开源开放深度学习平台,打下的是中国AI产业的根基,许多产业生态可以在上面成长起来。飞桨作为深度学习技术的龙头,代表中国参与全球竞争,在当前的国际环境之下,对于中国科技的自主创新意义也比较大。其次,飞桨作为深度学习平台的龙头,在四个维度上体现它的优势和意义。这四个维度分别是:技术、共享、应用和生态。我们就来细说说这四个维度。



01

第一个维度:技术的领先


深度学习框架是AI时代的操作系统、基础设施。不管是无人驾驶、智能家居,还是智能客服、物联网等等AI应用,都离不开它的开发、训练和预测服务。 飞桨作为百度的深度学习平台,集深度学习核心框架、基础模型库、端到端开发套件、工具组件和服务平台于一体,扎根于百度长期在深度学习领域的技术积累和产业实践,是国内最早,也是技术最丰富、使用人数最多的产业级深度学习平台。



目前,飞桨已经基本上形成了通用、灵活的特点,能够为AI开发者提供标准化、自动化、模块化的服务。AI开发者可以使用飞桨进行AI的开发、训练和预测,不需要再写大量的基础代码。飞桨丰富的模型库,包括智能推荐、视觉、自然语言处理、语音等等,可以直接被开发者引用来实现特定的功能。比如此次全新发布4大面向应用任务的产业级开发套件,实现了四大应用任务的全流程开发、训练和部署,更加方便实现应用落地。包括:NLP领域的ERNIE语义理解,CV方向的PaddleDetection目标检测和PaddleSeg图像分割,推荐方向的ElasticCTR点击率预估,降低开发门槛,满足低成本和快速集成需求。此外,飞桨还提供了越来越丰富的工具组件,新推出的联邦学习PaddleFL、图神经网络PGL和多任务学习PALM 3项深度学习前沿技术工具组件也在引领深度学习技术潮头。



进一步说,飞桨在四个环节上已经形成了技术的先发优势,包括:


1)开发便捷的产业级深度学习框架;
前段我们提到,飞桨的特色在于其支持的模型多,其核心框架采用基于编程逻辑的组网范式,对于普通开发者而言更容易上手,符合他们的开发习惯。同时支持声明式和命令式编程,兼具开发的灵活性和高性能。网络结构自动设计,模型效果超越人类专家。如此一来,开发自然较为便捷。


2)支持超大规模深度学习模型的训练;
互联网每天产生的数据是海量的,尤其是搜索,更是亿级的用户产生数百亿级别的数据。飞桨源自百度自身应用,百度的深度学习技术源自搜索,因此飞桨天生具备大规模数据的处理能力,并且搜索和推荐系统本身就是大规模数据分布式模型训练的主要应用场景。所以,从一开始,飞桨就被设计为支持超大规模深度学习模型的训练。
针对大规模稀疏特征,飞桨设计并且开放了大规模稀疏参数服务器,适用于超大规模数据、海量特征和自膨胀、高频率模型迭代的业务场景。


3)多端多平台部署的高性能推理引擎;
随着技术的进步,人们要求在电脑、智能手机乃至智能家居、智能穿戴设备等多个平台上都可以使用AI技术,这就对深度学习框架提出了较大的挑战。飞桨对推理引擎的底层架构设计进行改进,显著提升了其拓展性和兼容性,使得飞桨推理引擎能够在多硬件、多平台以及硬件混合调度的支持上更加完备。
据悉,飞桨的端侧推理引擎Paddle Lite 2.0能够支持的硬件平台非常丰富,包括ARM CPUMali GPUAdreno GPU、华为NPU以及FPGA等诸多平台。这种多端多平台的能力保障了人工智能应用落地移动端的要求。


4)面向产业应用,开源开放覆盖多领域的工业级模型库。
我们前面也提到,飞桨的模型库种类丰富,这些种类面向产业需求,目前已经可以在多个领域开展应用。我们目前可以看到,比如用在冶金领域,在电网检修领域,在工业故障检测领域,在农业监测领域,都可以找到种类丰富的各种案例。这些案例的应用,没有工业级别的模型库是做不到的。实验室用到的模型可以解决一两个技术问题,但是商业化对于量的要求、对于质的要求更高更苛刻。


02

第二个维度:共享的领先


要做好AI时代的操作系统,不开放是不行的。国外用的比较多的开源平台是Tensorflow,国内则是飞桨。其实大家近期可以看到,Github上面对于来自中国的开发者限制越来越多,甚至Github本身也不再给中国人发offer,美其名曰避免技术泄漏。在这种环境之下,采用Tensorflow对于国内的AI产业来说,有比较大的所谓断供隐患。


除了上面这一层担忧之外,Tensorflow虽然也是共享开源的,但是相对偏底层一些,使用的时候自己还是需要写大量代码,对于没有那么熟悉深度学习的开发者来说,入门难度比较高。飞桨的特点就是不仅开放开源,而且easy to use,很适合入门开发者迅速掌握。


好用,简单,是一个共享平台能够在业内迅速使用开来的很重要的优势。当然,作为一个共享平台,官方的支持力度也是相当重要的。飞桨的背后是百度这样一家中国本土的公司。在技术迭代、用户响应、本地化方面,飞桨自然是要比其他深度学习框架来得更贴近。百度不仅通过大量的培训、学习,帮助开发者理解掌握飞桨,还提供了激励、算力、开放平台、AI市场来帮助产业参与方共同做大做强,这里共享的不仅仅是技术,而是广泛的资源。
03

第三个维度:应用的领先


纵观国内,在其他行业内已经开展广泛应用的深度学习平台,唯有飞桨。


百度CTO王海峰曾经以自动提取农耕地块为例,介绍了飞桨的实际应用效果。基于飞桨的农作物地块识别,在遥感影像数据的基础上,中科赛诺将提取地块准确率高达80%,处理效率相对人工提升达数万倍,真正做到了高效辅助农作物生长、灾害监测、估计产量等等,把人力从农业生产中解放出来,对农业生产意义重大。在土地集中化、农耕机械化、人口红利锐减、农田无人耕作的现实下,使得深度学习做到了技术报国。


又比如,在电网领域,巡检是一个非常重要的工作。但是同时,这个工作非常辛苦,也相当危险。过去,由于缺乏人工智能的支持,即便是用机器人去采集数据,但是采集回来的数据也需要大量的人工分析,费时费力。直到南方电网与飞桨合作,通过AI算法赋能智能终端,帮助前端智能装备(无人机和机器人),把采集回来的图像数据进行智能化、自动化的处理,才真正做到了解放劳动力。如今,广东南方电网的机器人巡检可以在变电站顺利开展工作,巡检人员再也不用自己去检测,只需要进行数据的复核即可。巡检工作全天候开展,人工智能把人从危险劳累的环境中解放出来,可以从事更有创造性、更有效率的工作。



再比如,在钢铁熔炼领域,熔炼的过程中,如何精准控制合金添加量,如何废物回收利用,如何控制最佳冶炼时间,都是一个经验活。过去,这种工作需要老师傅来判断。如今,基于飞桨,精诺数据推出了智能熔炼系统,可以帮助钢厂工人更好的进行决策,来决定最佳的预配方案,保证成本最低化和质量最优化。以往,普通师傅精配步骤一般用时10分钟左右,而如今只需要几秒钟,这中间节约的时间能够让工厂的产能提高近一倍。原来一个老师傅可以看2个炉,现在可以看4个炉,效率提高了一倍。


在先进制造领域,创业公司硕橙科技和飞桨联合开发了机器听诊大师基于飞桨提供的智能语音识别模块,机器听诊大师可以通过机器生产中发出的噪音,来判断机器运作的状态,从而进行设备健康的评估。机器听诊大师获取实时生产者的音频数据,通过使用预先训练的机器状态识别神经网络对生产音频数据进行识别处理,继而给出相应的判断和评估。这些评估不需要在设备上开设新的接口实现数据联网,从而大大提升了它的延展性适用性。


像上面这样的案例还有很多。我们看到,目前飞桨在各行业中的应用推进非常快,越来越多的行业希望尝试飞桨在本领域的应用。
04

第四个维度:生态的领先


随着飞桨在工业、农业、服务业等多个领域的落地案例越来越多,并且开始产生经济效益,飞桨带来的AI生态也越来越丰富。据了解,目前飞桨已经服务了150多万开发者,拥有超过6.5万个企业用户,发布了16.9万个模型,这个体系已经成为了目前国内最大的AI生态。


这个生态拿到国际上去也是有竞争力的。我们当然也可以看到,类似Tensorflow这些深度学习框架也在持续不断的更新迭代,但是,由于中国是全球最大的互联网市场,也是最大的制造业国家,在中国有很好的基础在实现产业和人工智能的结合,这一点也是美国认为中国有比较优势的。


我们可以看到,中国产业发展的特殊性,使得越来越多的企业在尝试数字化、工业4.0的时候,直接就开始采用AI这里面,相当一部分将会是基于飞桨来进行开发。飞桨参与这个过程是非常深入的,提供的是基础设施是加速引擎的作用。中国的金融科技、智能制造、医疗健康乃至农业等各种行业,现在都开始使用AI来改善效率。可以预测的是,飞桨的渗透率会越来越高。反过来说,飞桨生态体系的建设,又会反哺飞桨的技术进步,帮助飞桨进行不断的更新迭代,让飞桨更加好用,这是一个正反馈循环系统。生态的领先是有先发者优势的,先发者赢者通吃的概率很大。


从上面四个维度来看,相信读者已经感受到了飞桨作为深度学习平台的意义。飞桨在技术、共享、应用、生态四个方向上的领先,决定的是中国参与全球人工智能技术竞争的高度。飞桨最后能做成的AI生态,也代表着中国在AI领域经济转型升级的成果。所以我们不仅仅应该看到飞桨作为世界互联网领先科技成果的意义,更要看到它背后是顶尖公司的竞争,是生态体系的竞争,更是国力的竞争。


 

*本文为向小田原创作品,未经授权不得转载,如需转载,请在后台申请。

推荐阅读


* 上期必读《阿里巴巴2020Q2财报中值得注意的几个点


* 热门文章《大兴机场的七种武器


* 热门文章《深圳:从“被抛弃”到“追不上”


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/49272
 
120 次点击