Py学习  »  机器学习算法

打破深度学习局限,强化学习、深度森林或是企业AI决策技术的“良药”

AI科技大本营 • 4 年前 • 329 次点击  


算法、算力和数据是人工智能时代的三驾马车,成为企业赋能人工智能的动力,但它们自身的特性也为企业和高校在研究和落地应用过程带来了重重挑战。比如,训练算法的成本高昂,数据从采集、处理到存储已面临瓶颈,目前针对算法的加速芯片已成为硬件开发商的一大趋势。但问题是,这些加速芯片是否能对不断适应提出的新算法?在这些挑战下,降低算法成本,加速训练,推进决策,已成为所以高校、企业共同迫切的需求。


8月31日,英特尔第二期AI实践者之声夏令营活动走进南京大学。南京大学人工智能学院教授俞扬、英特尔(中国)人工智能行业客户总监孙宇和创新工场南京国际人工智能研究院执行院长冯霁围绕打破理论与实践的壁垒,助力企业高效应用落地,推动未来人工智能服务新架构等内容进行了技术分享与探讨。

 

提高算法效力,打破强化学习落地门槛

 

机器学习中一个经典的分类是监督学习、非监督学习和强化学习。监督学习是预测的过程,而强化学习即为决策的过程。现在,人工智能的识别与预测任务已经得到了广泛落地。但实际应用场景中,如推荐系统其实是一个决策过程,并非预测任务,因此系统仅有识别与预测并不够,还需要完成大量目标任务,采取一系列动作或行为使之具备决策能力。

 

南京大学人工智能学院教授俞扬分享了《强化学习决策》主题演讲。他谈到基于强化学习技术的人工智能系统已在围棋、视频游戏等领域展示出了可超越人类的决策能力。不过除了可以玩游戏,强化学习系统是否可以在实际应用中发挥超越人类的决策能力,帮助人们更好的解决问题?

 

俞扬谈到,目前除了在游戏场景,强化学习难以看到应用成果,这与决策学习算法的局限性有很大关系,算法需要和环境进行多次交互,决策过程需要海量样本,其失败的代价现实中无法承受,导致其在真实场景中很难落地。

 

算法效率如何提高成为该领域一大主流研究问题。经过多方尝试,南京大学与英特尔合作,将游戏当做算法的效力检验平台,通过一台服务器4个CPU48个盒子,用了4天的时间完成了很多强化学习功能,打败了内置游戏 AI bot,减少了训练所需开销,提高了效率。

 


零试错是强化学习在实际场景中落地难的一大门槛。俞扬认为,打破这个门槛需要提高算法效力,构建一个高精度的模拟器。让算法走出虚拟环境,需要上百年,现在我们要把现实事件虚拟化。在真实数据中还原模拟器,在不同环境中实现,产生更多的数据积累,得到泛化能力更强的模拟器。未来,他希望人工智能的决策能力可以应用于现实场景中。

 

从软件到硬件,英特尔助力企业人工智能落地

 

夏令营活动现场,英特尔(中国)人工智能行业客户总监孙宇以《英特尔人工智能战略》为题,向大家介绍了英特尔人工智能的产品、技术、相关工具以及生态环境,阐述了英特尔人工智能的发展战略。



要打破人工智能与现实的屏障,英特尔广泛的布局覆盖至人工智能应用的各方面。社区、软件与硬件是战略布局的三个重要方面。首先,英特尔需要集合各方力量培育新兴用例、吸引和培养顶尖人才,来培养生态系统并推动其发展,引领人工智能发展的前沿;其次,英特尔需要塑造开源软件堆栈,优化客户软件,构建统一的API方便开发者应使用,然后释放硬件的潜力;最后,英特尔基于广泛的数据中心基础架构,交付最佳的人工智能平台,包含拓展的CPU,完整的产品组合,高集成度的平台。

 

现在部署一个人工智能应用过程繁琐而复杂,从数据收集、处理、分析、训练、上线、到推理、反馈,各环节架构也不尽相同,需要消耗高昂成本,性价比不高。第二代英特尔®至强®可扩展处理器无论是加速计算、还是决策过程,都显著提升了性能;同时搭配面向多样推理的硬件组合,强大的软件工具,加速开发部署,为企业提供最高效、性价比最好的解决方案。

 

只有算力的提升是不够的。算力之上,英特尔也注重计算围绕的数据,打破数据从产生、处理、到存储过程的瓶颈,做到更快传输、更大存储、更全的计算。

 

英特尔还提供了丰富的框架库套件帮助开发者快速开发与部署。数据核心MKL-DNN,支持各种主流框架,经过优化后,开发者可以直接调用;面向ApacheSpark,有深度学习框架BigDL可以使用,训练各类人工智能任务;工具包的一部分——模型优化器OPENVINO,可用于导入经过训练的模型并将其转为中建模型。



深度森林技术,神经网络之外的里程碑式探索

 

创新工场南京国际人工智能研究院执行院长冯霁围绕《深度森林技术简介》进行了主题演讲,并向大家介绍创新工场的人工智能实践,以及英特尔技术如何帮助企业进行并行训练与决策。

 

深度森林是周志华教授在2017 年提出的一项有望探索神经网络技术之外的一项重要技术。在深入理解深度森林技术与应用之前,还要先从深度神经网络讲起。冯霁在演讲中讲到,深度神经网络主要是利用一个多层的可微分的学习器进行模型训练,但是经过这几年技术落地的过程发现,深度神经网络并不能解决所有任务,其中一个挑战就是无法很好的对离散或表格数据进行模型训练。

 

用一句话总结深度森林的优势就是其用不可微分的树模型,不通过BP训练,其超参数数目远少于DNN。以金融风控平台建模为例,目前仍在使用一些不可微分的数据模型。基于对这类问题的分析,对学术界来说,构建一个多层的分离器成为一个重要课题,这在工业应用中也是非常值得探索的问题。

 

应用方面,通过与蚂蚁金服合作构建一个用于判断交易是否是套现行为的模型,在离散数据下,使用深度森林模型的解决方案比决策树、深度学习解决方案的效果有所提升。其中,基于深度森林进行分布式学习是一个重要方法。以前大家认为只要深度学习才能进行分布式学习,而目前英特尔提供的一种高性能解决方案是基于CRADIENTBOOSTING进行多层表示学习,如果再将CRADIENTBOOSTING在拓展的CPU上集成,不仅有对表格数据的优秀的计算能力,同时对这类数据还能学习分布式表示,这也成为目前很多金融科技公司最常用的解决方案。

 

不过,在实际工程中会遇到既有图像数据,也有表格数据的情况,此时需要建立一个混合模型,同时又可以输出一个决策,这就让我们在构建过程中,把不同构成单元组合成混合的学习系统,这个系统可以由神经网络构成,也可以由深度森林构成,来支持对不同类型的数据进行建模。

 


最后他强调,对于深度森林这类较深入的技术,大家还需要考虑数据集性质本身,而在任务中采用基于决策树为构建单元的模型,可以发挥出立竿见影的效果。

 

AI实践者之声夏令营活动第三期——深圳站活动预告

 

大数据、AI时代,在实现智能化转型的道路上,各行业企业面临着海量数据处理、机器学习和深度学习技术支撑、高昂计算成本以及技术人才紧缺带来的挑战。

 

金融行业作为目前AI技术落地最重要的行业之一,一直在寻求可以不断提高效率、降低成本,加强数据隐私保护的生产线,这就需要开发者不断增长技能,紧跟技术发展,帮助企业解决工程实践中的挑战,从而完成转型之路。为此,英特尔将和平安科技为广大开发者们准备一场AI技术交流沙龙,帮助开发者们在企业AI转型中的最新技术,掌握核心技能。

 

本次技术沙龙,我们将带领开发者了解AI 技术与区块链技术、联邦学习技术在金融行业的最新应用,让开发者们掌握最新的技术与工具,更有英特尔技术专家亲自带领现场开发者进行两小时的技术实操,助力开发者炼就硬核技能。干货满满,不容错过!


扫描二维码,报名加入 AI 实践者之声夏令营,成为 AI 实践者之一!



重磅嘉宾介绍

 

平安科技联邦学习技术部总经理

王健宗



王健宗博士,平安科技联邦学习技术部总经理,深圳市金融智能机器人研究中心常务副主任,中国人工智能开源软件发展联盟副理事长,平安科技副总工程师,资深人工智能总监,平安联邦学习平台和AutoML平台总设计师,美国佛罗里达大学人工智能博士后,深圳市领军人才,高级工程师。现任中国计算机学会大数据专家委员会委员,高级会员,YOCSEF深圳副主席,曾任美国莱斯大学电子与计算机工程系研究员,专注于联邦学习和人工智能在金融、保险、投资、医疗等领域的研发工作,发表深度学习、云计算、大数据等领域国际论文30余篇,以及专利100多项。多届国内知名大数据人工智能和联邦学习会议出品人。

 

平安科技联邦学习团队资深产品总监

卢春曦


 

卢春曦,平安科技联邦学习团队资深产品总监,本科毕业于美国华盛顿州立大学,获得澳大利亚悉尼大学硕士学位,负责研发设计和落地多项金融保险领域人工智能产品,包括AI翻译、AI农业、联邦学习蜂巢平台以及宠物识别等。

 

议题:平安科技AI实践案例联邦学习

议题介绍:随着数字经济蓬勃发展,全面智能化技术正推动传统生产要素全面转向智能化生产要素,助力金融产业链加速向跨界融合、融通发展、共享共赢的生态圈演进,最终推动数字经济迈向智能经济。本次演讲从平安科技丰富的金融业务场景出发并结合实践案例,深入探究人工智能和联邦学习如何便捷高效地赋能行业发展。

 

Intel中国金融行业客户总监

王东方

 


王东方先生(Wang, Dongfang) ,现任Intel中国金融行业客户总监,负责金融、保险、证券行业11年,曾负责教育政府行业两年、IT行业从业20年,曾推进金融移动展业、金融业务创新,和金融行业客户一起共同推进了金融行业技术创新、移动业务及交叉混业业务的发展。

 

英特尔中国区人工智能销售经理

Leon Lu 陆礼明

 


拥有超过16年的行业经验。2010年加入英特尔,负责过包括PC客户端,穿戴式设备,数据中心,人工智能专用芯片等多个产品线的技术支持和市场销售工作。


议题:英特尔人工智能产品和战略分享

议题介绍:随着人工智能技术的演进,能否顺利实现方案落地成为其发展的关键。英特尔的人工智能软硬件解决方案可以帮助企业实现方案快速部署,计算资源的弹性使用,易于维护的整体方案,成熟的云服务等,最终帮助企业将人工智能方案顺利落地。

 

英特尔中国区平台安全产品规划总监

李志强

 


李志强现任英特尔中国区平台安全产品规划总监。加拿大卡尔顿大学计算机系统和安全硕士。先后任职于朗讯科技、黑莓和英特尔。在通讯和数据网络,移动安全,和芯片级平台安全方面有着近20年的产业经验。在基于芯片的端到端的平台安全架构中,从产品规划、市场拓展、实际部署等不同维度,有着业界领先的的见解和贡献。

 

议题:英特尔助力区块链

议题介绍:英特尔对于区块链技术一直紧密跟进。除了不断提供基于芯片的各种硬件加速能力外,还创新性地提出了可信执行环境的具体实现。这些都为区块链的研究和发展提供了底层支持。同时通过与各种区块链联盟和行业组织的协作和参与,英特尔适时地推出了先进的锯齿湖(Sawtooth)项目以及隐私数据对象架构来解决区块链在安全、隐私和可扩展性等方面所面临的挑战和机遇。

 

英特尔亚太研发有限公司高级技术咨询顾问

罗毅

 


现任英特尔亚太研发有限公司高级技术咨询顾问,主要工作为在IntelOpenVINO平台上提供各类技术方案,协助开发者完成产品研发与性能优化。曾获多项专利授权,在腾讯等头部互联网公司有多年研发经验。长期关注计算机图形学、机器视觉与深度学习等技术领域,拥有澳大利亚伍伦贡大学计算机硕士学位。

 

Hands on lab 环节


Intel hands on lab:从模型训练到推理,打造AI最佳落地实践

 

本次实操内容主要分为两部分。一是训练模型阶段,包括准备和可视化数据集、超参数调整、培训和验证。二是部署到边缘并进行推理,这一部分将介绍英特尔®OpenVINO™工具包的功能和优势,使用模式;其次是模型优化器:优化模型,为预构建和自定义模型生成与硬件无关的中间表示(IR)文件;最后是推理引擎:部署到CPU,集成GPU、FPGA和英特尔®Movidius™神经计算棒。

 

hands on lab 参与要求:

1、请自行携带无线上网功能的笔记本电脑+充电器 

2、通用版网页浏览器  

3、Intel® AI DevCloud账号(活动现场创建免费账号)

*特别福利:参与 Intel hands on lab 还可获得 Intel 认证 !

 


附活动详细日程

 

时间:9月17日  09:30 - 19:15

地点:深圳市南山区科技南十二路20号平安科技一层

 

 

点击阅读原文,报名加入AI实践者之声夏令营,成为AI实践者之一。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/40294
 
329 次点击