AI-108将 | 我们去习近平总书记重点视察的研究所，听两位研究员讲了讲人工智能机器学习领域的现状和未来

点击上方“AI时间”，关注并设为星标

加入人工智能技术社区！

这里是《AI108将》第四期。

AI时间专访中科院自动化研究所研究员

向世明

中科院自动化研究所副研究员

孟高峰

采访人 TMT行业分析师

邢书博

《AI108将》是AI时间全新的AI行业人物专访栏目。

艾伦·麦席森·图灵说：有时，那些人们对他们并不抱有期望的人，却能做到人们不敢期望的事情。Sometimes It's very people who no one imagines angthing of who do the thing no one can imagine.

百度李彦宏说：为什么大家觉得人工智能没有用？我在美国读书的时候，我就很喜欢人工智能这门课，但是学完之后，教授说其实没用。

“人工智能没有一个真正有商业价值的应用，你将来靠这个是找不着工作的。”

现在，全球AI领域从业人员仅30万，但人才缺口达到了200万。

对AI不抱希望的美国教授，恐怕现在很难理解中国政府将人工智能写进《中国制造2025发展规划》的初衷。

但中国的AI从业者懂。

我们寻找在中国的人工智能领域已经占有一席之地，或者正在路上的创业者，投资人，专家和媒体人，试图通过他们的故事来拼起属于我们中国的AI谱系。将不可能变为可能只是前菜。我们希望几十年后科兹威尔的奇点临近之时，《AI108将》可以作为一部真实可信的历史文献，供后人（或许是机器人）参考研究。

ALL IN AI，ALL IN人工智能。

中国科学院自动化研究所成立于1956年10月，是我国最早成立的国立自动化研究机构。1968年，为加速我国空间技术的发展，自动化所整建制划入空间技术研究院，更名为空间控制技术研究所，番号中国人民解放军第五○二研究所。1970年，根据自动化学科技术发展的需要，中国科学院重建自动化研究所。

（图片来自：AI时间摄制）

作为国之重器，历届党和国家领导人都十分重视自动化所的规划和发展，并多次视察。

（1958年，毛泽东主席和郭沫若院长等领导人参观中科院自动化所研制的长江三峡船闸自动控制模型。图片来自：AI时间摄制）

（1987年，邓小平同志接见自动化所留学归国人员。图片来自：AI时间摄制）

（1997年，江泽民同志在展览会上饶有兴趣的参观并试用自动化所开发并生产的汉王手写体汉字识别系统。图片来自：AI时间摄制）

（2000年，胡锦涛同志在中国专利法实施5周年成就展上与自动化所研究员、汉王科技总裁刘迎建等同志亲切交流。图片来自：AI时间摄制）

2017年，中科院自动化所人工智能论文量中国第一，全球第七。中科院自动化所是我国在人工智能研究领域真正的桥头堡和领头羊。

习近平总书记一直关心和支持中国人工智能领域的发展。

（2010年，习近平同志在全国科普日上参观自动化所智能交通项目，并听取自动化所科研人员关于项目情况的汇报。图片来自：AI时间摄制）

7月25日，国家主席习近平应邀出席在南非约翰内斯堡举行的金砖国家工商论坛，并发表题为《顺应时代潮流　实现共同发展》的重要讲话。

图片来自：新华社

会上，习近平同志再次对我国的人工智能产业表达了期许和鼓励。

“未来10年，将是世界经济新旧动能转换的关键10年。人工智能、大数据、量子信息、生物技术等新一轮科技革命和产业变革正在积聚力量，催生大量新产业、新业态、新模式，给全球发展和人类生产生活带来翻天覆地的变化。我们要抓住这个重大机遇，推动新兴市场国家和发展中国家实现跨越式发展。”

《AI时间》作为AI领域行业媒体，有幸采访了中科院自动化所两位研究员，向世明和孟高峰。我们就人工智能领域的机遇和挑战，现状和未来，对两位研究员做了相关专题采访。

向世明，研究员，博士生导师，研究方向为模式识别理论与方法、计算机视觉、大数据分析。2004年7月获中科院计算技术研究所计算机应用专业博士学位。目前任中科院自动化所模式识别国家重点实验室研究员，中国科学院大学兼职教授。

迄今已在高水平国际期刊或主流会议上发表论文100余篇，包含IJCV、IEEE T-PAMI、IEEE T-IP、IEEE T-NNLS、IEEE T-KDE、IEEE T-SMC-B、IEEE T-MM、IEEE T-CSVT、IEEE T-GRS、PR、ICCV、CVPR、ECCV、IJCAI、AAAI、CIKM、ECML等。其中，以第一作者在IJCV、IEEE T-PAMI、IEEE T-IP、IEEE T-NNLS、IEEE T-KDE、IEEE T-SMC-B、IEEE T-MM和PR上发表论文十余篇。

向世明在模式识别与机器学习领域具有近十年的教学经验，为硕士生或博士生主讲《模式识别》和《机器学习导论》等课程。

孟高峰，副研究员，硕士生导师，研究方向包括图像处理、计算机视觉和机器学习等。2009年6月毕业于西安交通大学，获控制科学与工程专业博士学位。现为中科院自动化所模式识别国家重点实验室副研究员。

迄今已在高水平国际期刊或主流会议上发表论文50余篇，包括IEEE T-PAMI、IJCV、IEEE T-NNLS、IEEE T-IP、IEEE T-MM、IEEE T-CSVT、PR、ICCV、CVPR、ECCV、ICDAR等。其中，以第一作者IJCV、IEEE T-PAMI、IEEE T-IP、ICV、CVPR、ECCV等顶级国际和国际会议发表论文十余篇。

孟高峰在本领域具有丰富的教学经验，为硕士生主讲《机器学习导论》等课程。

为保证专业性和准确性，这次采访使用“Q&A”形式呈现。

（注：案例部分由AI时间独家提供）

以下是采访内容。

深度学习并没有带来机器学习的颠覆性革命

AI时间：36氪刊载的国外学者Fabio Ciucci文章认为，深度学习并非AI的未来。

文中举例说：比如AlphaGo只用到了深度学习，但是实际上它是 Monte Carlo树搜索算法+深度学习，并存在证据证明单单靠深度学习不足以让它获胜。许多强化学习任务是由NEAT算法（通过增强拓扑的进化神经网络）实现，不是基于BP的神经网络算法。这些都是人工智能领域有关深度学习的误解。

你怎么看待这个问题？请从学术角度及技术实现角度分析之。

向世明：深度学习的确在很大程度上改变了传统的模式识别系统构建的套路。比较突出的一个工作范式是，在深度学习的框架下，传统的特征提取、模式分析、模式分类等几个相互独立、分阶段、分步骤的串行技术构建方式将被融合于一个迭代学习系统之中。也就是说，它使特征学习、分类器设计可以相互联系在一起，变成一个端到端的迭代的学习系统。

因此我们会看到深度学习改变了模式识别技术构建的理念主要在于如下两点：

其一，将固化的特征提取变成数据自适应和任务驱动的特征学习；

其二，引入了一个端到端框架性思想。因此，严格地来讲，深度学习的成功最受益的领域是模式识别。

本质是讲，上述两点是一致的。但“端到端”的概念使得我们力图将数据和模式识别的最终任务进行关联。这一点正在改变我们的思维方式和工作方式。因此，严格地来讲，深度学习的成功最受益的领域是模式识别。这些领域主要包含计算机视觉、自然语言处理、语音识别。属于可见、可读和可听的领域。相对来讲更多地涉及“感知”这一块。从技术上讲，里面涉及到一个将感知到数据进行分类的问题，是一个从数据到属性的映射过程。深度学习正好适应这类任务。

而我们广大的民众直接产生的也是这些数据，面对的也是这些数据。所以深度学习给我们的错觉是它似乎可以包打天下。我们说，对于有丰富数据的地方，我们鼓励大家去使用和发展深度学习方法反之则不然。因此，无疑深度学习在AI中的地位是十分重要的，其应用前景也是光明的。

孟高峰：客观地讲，深度学习并没有带来机器学习的颠覆性革命，也不是未来AI的唯一技术。

AI是一个综合性的技术舞台。理想的AI所需要解决的技术是十分复杂的，任务类型是多样的，技术应用环境是多变的。因此，它不仅仅是数据驱动的学习。

最重要的，除了力量与速度之外，我们期待它所做出的系统具有类人的特点。但这一点深度学习很难做到。其实，在学术界，国内的一些机器学习大牛并没有跟风深度学习，而是坚持做深度学习以外的研究。百花齐放的重要性对AI来说是十分必要和重要的。

AI时间案例补充：深度学习之外的技术路线一样精彩

“深度学习，是指使用深度神经网络的统计学习模型。”北京智能一点科技公司CTO莫瑜解释，“深度学习只是机器学习的一种方法，但它火了之后，大家有时甚至将机器学习和深度学习并列起来。”

也就是说深度学习与机器学习是部分与整体的关系。然而由于深度学习的火热，使得它在很多人心目中已经成了机器学习的代名词。

事实上，除了深度学习之外，还有“决策树、随机森林、图模型等各种机器学习的方法”。莫瑜说:“大家言必称深度学习，使得深度神经网络之外的技术路线被忽视了，这不利于技术的发展。因此会有学者呼吁大家保持冷静的态度。”

杨立昆认为人脑只属于人，AI要拥有同样的智能，不需要类似人类的认知能力，可以另起炉灶，深度学习可以承担构建强人工智能的任务。

马库斯则认为，只有通过类人的方法来理解世界，AI技术才能取得成功，而具备人类相当水平的强人工智能研究压根还没开始。可以推测，他所说的类人研究方法应该包括对人类神经、心理等的生理学破译等研究工作，马库斯正是纽约大学的心理学和神经科学教授。

2017年12月18日，《科学》杂志刊登了一个叫Libratus的AI成果，它在持续了20天的12万手比赛中击败了4位顶级人类玩家。它的设计者卡内基梅隆大学博士生Noam Brown说，其间不使用任何深度学习，希望有助于人们认识到AI比深度学习更重要，深度学习本身不足以玩扑克这样的游戏。

深度学习提倡直接的端到端的解决问题

AI时间：深度学习和机器学习的区别是什么？大众理解的误区有哪些？他们之间的主要异同点有哪些？

孟高峰：深度学习是一种实现机器学习的技术。从统计学习的角度看，它与传统的机器学习方法没有太多区别，那就是从大量的数据中进行学习，然后对未来做出决策或预测。

从实现学习的技术手段上看，深度学习最鲜明的特点是它有一个层次式的结构。即多层神经网络。这个结构十分灵活，即我们可以让神经网络变得无比巨大，不断增加层数和神经元数量，然后采用大量数据来训练它。

深度学习可以实现对数据的非线性复合映射，也可以实现无监督、半监督和迁移学习等多种不同的学习任务。

传统的机器学习对于监督学习和无监督学习均有其自身的模型或体系。这些模型在不同学习任务之间的转化通常比较困难。比如谱聚类和支持向量机很难放在同一个学习模型之中。

向世明：问题解决方式不同：传统机器学习通常将学习任务分解为多个子任务，按串行的不可更改的方式去逐个完成，并获得最终结果。

相反，深度学习提倡直接的端到端地解决问题。深度学习是一种表示学习方法，将特征学习与学习任务进行关联。

传统的机器学习方法大多是风险最小化学习，它假定实例的特征是足够支持完成相关学习任务的。当然，总体上讲，目前采用深度学习方法完成模型训练的驱动力也源自于风险最小化策略。但是，借助于灵活且强大的结构，这种表示学习方法所带来的最大惊喜在于，随着数据的增长，深度学习的性能会越来越好，但传统的机器学习模型通常并不会因为数据的增长其性能会一起增长。

传统的浅层机器学习方法大多可以从贝叶斯最小风险学习、最大MARGIN等统计的或几何的角度加以解释。但是，深度学习的可解释性不好。它为什么有效，目前很难从学习理论上给出完美的解释。

AI时间案例补充：深度学习离开数据标注可能无法实现

7月12日，北京市北五环外西二旗一家数据标注工厂里，一群年龄大多不到20岁的新标注员正听资深员工讲解工作中容易出现的问题。她们标注的数据将被用于人工智能算法的训练。

所有人工智能（AI）都离不开深度学习系统，这个系统的技术提升依赖大量人工完成的标签化数据。数据在人工完成筛选标注后，交由机器自我学习，标注数据的人被称为标注员。这些数据将被用于人脸识别、安防、无人车驾驶等，这是整个AI产业的基础，是机器感知现实世界的原点。

21岁的张嵛森毕业于山东一所劳动技术服务学校，同期毕业的同学有的去了114查号台，有的去了联通、移动等电信公司做客服。他的室友阿宽今年17岁，刚刚入职不久。阿宽说，虽然每天坐在办公室里，但通过来自世界各地的照片可以认识外面的世界。这也是张嵛森认为自己比其他同学幸运的地方，“这是一份有趣的工作”。

张嵛森的女友林雪在工厂中负责质检，一天要检查2000多张处理好的图片，需要时刻保持紧张的工作状态。林雪的客户会在500张做好标注的图里进行抽查，做错一张图，那500张就不会按照原价付款了。遇到人脸标注的照片时则需要抽查10%，如果错误率超过1%，客户就会要求更换标注员和标注账号。

除去容错率，另一个最重要的规则就是信息保密。每一台计算机都禁用USB口，标注员在封闭并且被监控的情况下处理数据。数据被交付给标注员前会先做碎片化的“脱敏处理”：一份表格被打散，再分发给终端节点作业员，每个标注员手中拿到的只是表格中的一部分。

对人工智能研究来说，

企业高校和科研院所机会均等

AI时间：2012年，《中国市场》杂志的一份研报显示，利用柯布—道格拉斯生产函数和主成分分析等方法,研究测算了1992—2007年我国高校和科研机构研发效率。研究结果表明高校的研发效率要高于科研机构,并呈现出逐年提高的态势。

另一方面，过去两年，国内机器学习领域的领头羊百度投入200亿资金用于技术研发。

请试着从经济效益\社会效益\学术效益等方面，比较高校科研\企业科研\研究所科研对于人工智能领域的技术发展的作用和各自优势。如有年轻学生问你同样的问题，如何帮他做出选择？

向世明：2017年7月，国务院印发《新一代人工智能发展规划》，对我国人工智能发展做出总体部署；

2018年政府工作报告也明确提出“加强新一代人工智能研发应用”。

继2017年5月国科大成立人工智能学院以来，国内高校成立了大量的以人工智能研究为主的学院。

高校是人工智能的第一人才资源，在人工智能基础研究和学科发展等方面具有鲜明特色与显著优势。

我国国有研究所的主要任务是面向国家重大需求、国民经济主战场和世界科技前沿，围绕国家发展战略目标需求，承担相关研究工作。因此，对于人工智能而言，研究所在人工智能的前瞻性基础理论与方法研究、关键技术构建、应用环境探索与验证、面向行业的深度应用、系统集成与示范应用等方面均发挥着重要作用。

以BAT等为首的企业科研成为当前人工智能浪潮的排头兵，它们在人工智能技术的落地应用、人工智能新产品研发、应用模式探索和未来AI技术研究等方面发挥着巨大的推动作用。相对于高校和研究所，企业在数据资源和计算资源等方面具有显著的优势。同时，这些优势有力地促进了相关技术开发，也正在AI的基础研究层面得到显现。

的确，人工智能是一个充满活力和十分具有吸引力的方向。系统的专业知识、踏踏实实的实践和创新精神的永远保持将是人工智能领域从业人员的基本要求。这一点无论是高校、研究所和企业都是需要的。对所有的人，成功的机会也是均等的。

AI时间案例补充：AI领域投资有泡沫，但还没扩大

据《每日经济新闻》报道，从创业投资领域角度来看，美国面向全产业投资，投资领域遍及基础层、技术层和应用层，而中国接受融资的企业主要集中在应用层。联想之星主管合伙人王明解释了应用层受到青睐的原因：

“人工智能的投资方向可分为几个阶段，在2011年、2012年我们会投资识别，底层技术。随后发现，底层技术一直由大公司来做，后面也越来越不好投。因此，无论是创业还是投资最主要的是抓应用，在某个方向的应用。而投底层技术则会受到大公司的打压，未来的生存空间并不太大。说到建议，最重要一点还是要选择自己熟悉的领域做投资。”

对于“泡沫”这种说法，有业内人士认为，“泡沫是一定存在的，尤其是对于一级市场的投资。从投资角度来看，只能说人工智能的泡沫比其他行业没有更加明显的表现，因为现在整个一级市场的大环境与此前市场疲软时不同。”

“投资的时候我们考虑的是，是否泡沫已达到了难以接受的地步，但我认为现在还没有。”

工信部赛迪研究院人工智能分析师向阳则坦言：“相对来看，大家可能觉得期待值大于产出就存在泡沫，但泡沫其实有助于推动产业发展。”

深度学习的风险会给我们带来新的问题，

但数据隐私问题需要全社会通力合作

AI时间：有学者认为，深度学习的公正性并不来自于它本身，而是来自于人类选择并准备的数据。

“如果一个深度学习模型训练了100多本书：40本讲了憎恨、战争、死亡和毁灭是多么糟糕，60本书讲了希特勒的纳粹主义是正确的，那么深度学习的结果将是100%纳粹了。”

深度学习的学术风险在什么地方？需要警觉还是拥抱？如何打消公众对于AI的刻板印象？

孟高峰：从某种意义上讲，深度学习的确是采用蛮力取胜的。这取决于你有多大的数据和对数据准备的精心程度。

但对于同样的数据和任务，每个人可能给出不同的结果。因此在应用深度学习技术时，模型构造和训练细节均十分重要的。

当然，我们是欢迎深度学习的。我不觉得它有什么风险，反而会给我们带来新的研究问题。

AI时间：2018年5月25日的《通用数据保护法规（GDPR）》。在这一天，欧洲的大多数APP将去除深度学习，导致许多人工智能初创公司快速将深度学习替换成其他的东西，否则将面临罚款。罚款金将高达全球收入的4%，包括在美国的收入。

就在几天前，AI时间援引新华社报道了大数据企业数据堂倒卖用户数据被连锅端。

深度学习离不开数据，非法数据获取在我国屡见不鲜。如何解决？

向世明：数据是核心。就正如汽车没有油一样，没有数据，深度学习就跑不起来了。

但是，大量的数据堆积而不加利用也是一个巨大的浪费。

数据的利用必须是隐私得到尊重和保护的前提下进行。数据脱敏、隐私保护和数据交易均需要政府从法规层面加以解决。

AI时间案例补充：中国隐私保护任重道远

中国版《欧盟隐私法案》，即《信息安全技术个人信息安全规范》，今年1月获批，5月1日正式实施，引起广泛关注。FT中文网结合国内一系列数据保护措施，称中国为“亚洲数据保护的先行者”。

该规范对个人信息的收集、保存、使用、委托处理、共享、转让、公开披露、安全事件处置以及组织的管理要求等提出一系列要求。比如，相关方在收集、共享、转让个人信息时需要得到用户“明示同意”的规定就常被人提及，称其“比欧盟还严格”。

不过，该规范的起草人之一、北京大学互联网发展研究中心高级顾问洪延青曾公开表示，“规范在制定时，可能会比美国稍严一点，但是绝对不会比欧洲更严，而且与欧洲拉开了一定的距离。”

需要指出的是，该标准只是推荐性的国家标准，并不具有强制力。但是，对于它的广泛讨论显然有助于人们提升隐私数据保护的意识。

今年3月26日，百度公司董事长兼首席执行官李彦宏在2018年中国发展高层论坛上说，

“中国人对隐私问题更加开放，或者说没有那么敏感，如果要用隐私来交换便捷性或者效率的话，很多情况下中国用户是愿意这么做的。”

这番话在网络上引起了很大的争议，很多人直呼自己并不愿意，而是“没有选择”。尽管李彦宏在同一个演讲中还说了“用户信息安全保障是所有互联网公司的生命线，我们有责任保护用户信息安全不被侵犯”，人们的注意力还是集中到“隐私便利论”上。

舆论的情绪或许是出于对数据保护现状的不满，比如手机经常收到“垃圾短信” 、网络电信诈骗层出不穷。

国家互联网金融安全技术专家委员会数据显示，截至今年 5 月，已经发现了 2万余个存在异常的互联网金融网站和近1500个互联网金融网站漏洞。5月底发布的《数字金融反欺诈白皮书》指出，2017年“网络黑产”从业人员超 150 万，年产值达千亿级别。

《工人日报》报道称，去年流入“个人信息黑市”的信息达到65亿条次，平均每个中国人的个人信息都被泄露了5次。

对于这一点，在北京停留了一周的托斯谈到了文化差异的影响：“对于数据保护，没有万能的解决方案。这当中存在许多变数，也有一些在中国被认为是正常、宽容和可以接受的事情，放到美国去就完全不一样了。而美国和欧洲在思维方式和心态上又有差别。因此，没有万能之方。”因此，中国的隐私数据保护还需要政府监管、企业责任到个人意识的合力探索。

在这样的背景下，中国出台的数据保护规范只是一个新的开始。

深度学习不是类人研究，

学好数学和编程很重要

AI时间：Jeff Hawkins 的《论智能》中提到：

人脑本质是预测。预测的实质，不过是「生物的应激性」在「生物自平衡机制」&「环境压力」下产生的副产品。智能的核心是某种「稳定不变的东西」。而这得益于大脑皮层同质的层级结构。

“大脑皮层在外表 & 结构上存在着惊人的同质性。也就是说，大脑皮层使用相同的计算方式来完成它的一切功能。人类展现出来的所有智能（视觉、听觉、肢体运动……）都是基于一套统一的算法。抽象的本质的是恒定表征，大脑神经元提供了逐层抽象的通道。”

对于深度学习而言，卷积提供了获得恒定表征的手段，神经网络提供了逐层抽象的通道。但目前的机器依然无法达到人脑的智能水平。原因在哪里？产业界和学术界能做什么？

向世明：从结构上看，我们的深层神经网络并不是类脑的；

从功能上看，深度学习所实现的功能也不是类人的。深度学习可以实现从数据到属性的预测。

从本质上讲，这种预测是一种函数映射。同时，即使是函数式预测，它难以借助对小样本的学习来实现决策，难以在不熟悉的新环境中作出决策和预测。另外，它很难实现推理。

也就是说，深度学习在认知上并不是类人的。

值得一提的是，在学术界，类脑研究正取得积极进展；