社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

唐文斌:从清华姚班到Face++创业,我是怎么开始做机器学习的?丨二叉树视频

InfoQ • 5 年前 • 433 次点击  


   记录与时代并行的技术人,暌违已久的二叉树短视频回来了!叩问过技术大牛的「初心」,描绘过技术人的「众生相」,这次我们带您去见识那些横跨「两界之间」的技术人们。这是 10 位行走在中国人工智能之路上的技术人,他们正见证着中国的人工智能技术落地。点击公众号菜单「戳」一栏“二叉树视频”可观看往期高清视频。

「我希望人工智能不要这么热,我希望大家可以更安定下来去思考技术、业务价值、落地的产品,而不是泛泛而谈人工智能这个概念,它的未来、明天是什么。我们应该要具有技术信仰,更要去思考技术怎么发展,同时把技术、业务、产品做扎实,把该交付的价值交付。现在这个社会,人工智能是过热的。」

本集二叉树的主角是 Face++ 旷视的唐文斌。跟这样一位人工智能领域一家高速运转的明星初创企业的 CTO 展开采访,“人工智能”是理所当然的核心话题;不过在今天,唐文斌还想聊聊他最近投入大量精力发起的另一个有趣的事情。且看本集二叉树视频——



《两界之间》技术专题纪录片 | 第五集

由 InfoQ 二叉树 出品

嘉宾简介

唐文斌,Face++旷视联合创始人兼 CTO,2050 志愿发起人。清华大学计算机系研究生,ex OIer&ACMer,ACM/ICPC 2008 WorldFinals 排名第 6,首届“Yao Award”金牌获得者,北京市海淀区十大杰出青年。

2018 年 4 月 13 日的下午,二叉树团队与另外两个 2050 志愿者团队一起等待着唐文斌的到来。他将以 Face++旷视 CTO/2050 大会志愿发起人的身份接受一次采访。

Part I:对人工智能如是说

 Q:您是怎么开始做人工智能的?

我其实不是特别喜欢人工智能这个词。因为我们现在做的所有的“AI”,所有的人工智能,本质上都是机器学习,其实都是用一个数学模型去定义我们最后要优化的目标是什么,然后去最小化这个 function,最后我们去学出了一个东西,对吧?但我们现在真正对所谓的智能的理解,其实还在一个非常浅薄的程度上。

印奇和我差不多是从 2011 年开始关注深度学习。我大学期间做的事情还是偏非深度学习。我研究生的方向做的是社交网络的数据挖掘,比方说我能在社交网络去猜这两个人是什么关系,这个人是这个人的老师,这两人是家人,根据你的社交网络上的一些行为去猜你的关系;再比如说去你去 follow 了一个人之后,这个人会不会 follow back?我们做了很多这样的一些预测,其实也很有趣。

后来我的导师唐杰老师有半年要去国外,就让我去 MSRA(微软亚洲研究院)实习。我去的组以前叫 web search and mining,做文本搜索和挖掘的,然后去了之后小组说我们要改名了,改成 social media search,sms 小组,要开始做社交媒体搜索,要开始对图像、对视频进行基于内容的检索,他说你感不感兴趣?

我说来都来了,那就做呗!我们当时做了一个小的、房子的搜索引擎,比方说你拍一张照片是埃菲尔铁塔,然后我可以帮你搜出来埃菲尔铁塔的各种其他的照片。把它做出来之后,你会发现说你做的技术它能够很明确的有个呈现,这件事情就会很有成就感,所以会很好玩。

印奇当时也在微软做图像的一些工作,所以我们俩开始聊得比较多,就说图像这个方向很有意思。我们觉得未来的机器人一定都会需要一双眼睛,像人眼一样去看到这个世界、去看懂这个世界,把这些信息能够提取出来,这件事情现在的技术是在快速的进步当中的,我们觉得未来可以是作为我们创业的一个方向。我们反正聊的比较多,后来到某一个时间点的时候也开始付诸行动了。

那时候深度学习还不太热。然后我们开始关注的时候也不太热,只是有一些新的 work 出现,大家说这个是个值得尝试的方向,这个时候其实大家很多人就开始去试,然后我们试了之后觉得这是个挺 promising 的方向,我们也就加大了我们的投入。

当时我们觉得这是个正确的方向,这件事情一定非常有价值,而我们自身又是做这个方向的研究的人,我们希望能够把这个方向能够做的更好,能够把这种价值更好的呈现和交付出来。

 Q:您会关注脑科学吗?

其实做脑科学研究的书还挺有意思的,就是说他在讲到底什么是智能?智能的原因是怎么形成的?然后我们到底对现在的这种智能的原理有多少理解?我觉得现在都是在一个非常浅薄的状态。有一本书叫《On Intelligence》,还是挺有意思。

我讲讲我对强人工智能的理解。就是说我们假设这个世界是有规律的话,那么这个规律理论上应该是可被模拟的,我们人假设没有灵魂存在的话,那么你就是一些细胞、一些化学物质的一个有规律的运行体。那么你在这样的一个情况下,你的人的所有的活动其实是可以被模拟。如果这个东西可以被模拟,如果人没有这种更高的灵魂的存在,那么你模拟出来的东西其实就是一个“强人工智能”。

 Q:有的人认为可能不需要去研究人的智能怎么做,只需要让计算机能够实现一些原来实现不了的事情就可以了?


当然,机器学习,我们现在所有的人工智能公司做的都是这一件事情,大家用深度学习,用各种各样的机器学习的方法,然后去解决问题,去解决路径规划导航的问题,去解决自动驾驶的问题,去解决医疗上的智能判断的问题,大家都是在做这样一些事情。

 Q:机器学习是属于一种特定的方法论了?


对,机器学习,相当于有个老师在教你,然后你用一种数学模型去规划、去定义这个问题。你说它智能吗?它不智能。

机器学习这个领域,我觉得现在发展非常快。现在大家看到像我们这样公司能够在这几年里面相对快速地成长,也是因为有一些历史性的技术的机遇,因为深度学习的快速发展。

深度学习,在计算机视觉的领域,能够把以前只能做到 70% 的水平,现在能够提升到 95%,原来不能用现在变得可用,原来可能我们在城市大脑的场景下,你报警说这是个逃犯,可能报十次里面九次都是错的,永远都是狼来了;现在报十次,可能九次都是对的,带来的价值是完全不一样的。

 Q:这一切都是从 ImageNet 之后开始发生吗?

我觉得 ImageNet 之前就有。

 Q:为什么之前的东西都没有走进我们的视野?

因为你不是专业的:)

现在其实更多人觉得人工智能真的火起来是因为 AlphaGo 对吧?AlphaGo 之后大家觉得说,真的人工智能很强,现在的算法变得如此的强大,以前好像根本不能做到东西现在都可以做了,但实际上机器学习、深度学习的相关的一些发展,神经网络的一些发展,其实一直都在进行的。

神经网络其实研究了几十年了,60 年代就有人开始研究。神经网络以前为什么效果没有那么好、被束之高阁的原因是因为,第一数据不够多,第二计算能力不够强。现在有了 GPU 的计算,有了这种高性能计算的模式,有了更多的数据,然后使得它的性能比以前能够有一个很大幅度的提升,这个方法被重新挖掘了出来。现在的深度学习的很多基础理论都跟以前的神经网络是沿袭的。

 Q:作为一个人工智能领域的创业者,您希望给社会带来什么价值?希望社会给你什么帮助?

欢迎大家多多采购我们的产品和服务!你这个问题很容易回答的很 low:)你要这样想,创业者通常是一帮为了解决眼前的现实问题而站出来的人,哪里会想那么高大上的问题?但是我们可以随便聊下。


我们希望人工智能不要这么热。我觉得现在人工智能从资本到媒体都过热,大家都在讲人工智能,所有带电的公司都说自己是一家人工智能公司。这没有意义!

我自己其实想说,我们不是一家人工智能公司,我们是一家以人工智能技术为核心的产品和服务公司。最终你还是要回到说,你最后交付的产品、最后交付的服务是什么?你给谁去提供什么价值?这是一个真实的想法。我觉得在这样的一个时代里边,大家能不能沉得住心,能不能真的 focus 在技术、在产品上,能够有技术信仰,但同时又脚踏实地,我觉得这是非常关键的一件事情。

Part II:从 2050 谈开去

本集二叉树视频的诞生,与 2050 大会有千丝万缕的联系。身为一家众人瞩目的创业公司的 CTO,唐文斌的日常处于忙成狗的状态,做一个视频采访对他来说已经是一件奢侈的事情。然而一听说这次采访是为了 2050 大会,他二话没说就接受了。

下面是一段唐文斌与 2050 大会的小故事,与诸君共赏:)

话说在 2017 年冬天的一个夜晚,唐文斌原本计划要去滑雪,结果临时被王坚博士(阿里巴巴技术委员会主席,本季二叉树第一集嘉宾)约在机场见面。不巧航班晚点,他从下午 6 点一直等到晚上 10 点,与王坚博士聊完之后已经是午夜。再后来,双方在另一个时间另一个地点再次见面。

Q:还记得当时的情况吗?怎么被博士忽悠进 2050 大会的?

那天晚上我记得应该是在中关村的皇冠假日酒店,我们在那边等了他好久。然后他说他觉得现在大部分会都不是给年青人开的,所以他感觉应该要有一个面向年青人的活动,能够让优秀的人能够聚在一起。然后他就说,文斌你以前搞竞赛的,你应该认识很多优秀的小伙伴们,你去把他们拉过来。然后我就跳坑了。

我觉得能够有这样的一个平台、一个场地,能够让更多的人的声音能够被交换,能够被发出来,让更多人听到,我觉得是一个很有意思的事情,活动上还是集聚了一批非常有意思的人。

Q:所以相当于一开始的版本就是搞一个 ACM 竞赛?

也不是。一开始就是说大家过来一起来聚聚,玩一玩。我也没听说要卖门票啊!

Q:介绍一下你现在在筹备的东西?

我有一个团聚,主要是邀请以前 ACM 竞赛的同学们重温一下当年竞赛的场景。然后我们还会联合为云栖小镇做一个超高精度的建模,AEE无人机航拍成组照片回传,Alitzure负责3D重建,我们通过图像识别标注示意,最终在8K电视上呈现。

Q:您多次提到“有意思”这个词。这是您决定做不做一件事情的主要动机吗?

是啊,开心很重要,对吧?比如说我蛮喜欢滑雪的,然后你觉得滑雪的乐趣在于哪里?乐趣就在于你从山上下来的时候那种驾驭感,对吧?然后你说这给你带来了啥?其实我们又不是专业的运动员,我们虽然说在追求进步、在追求提升,但你都是在追求这种叫做进步和提升过程中的这种“有意思”和“快乐”,对吧?

其实我们所有人的兴趣爱好其实都是这样。我们参与这个活动,有像 Kevin 这种朋友们也在这里边,大家觉得这事挺有意思挺好玩,我们也愿意付出一些我们自己的时间,一起来做一些事情。

Q:您自己觉得“2050 年”会是什么样的?

2050 年到现在还有 32 年,我肯定能活到那时候,对吧?

我觉得 2050 年会有非常多的变数,因为我们现在的科技的发展其实是很指数级发展的,我们看过去的一两百年的发展要比以前 5000 年的发展可能都要快,然后我们最近的 10 年 20 年的发展可能要比前面的几十年的发展还要快,所以它都是在一个更指数级的方式在提升。

Q:您觉得这样的指数级发展会继续持续下去吗?

我不知道。我们是脚踏实地的干活者。

但是,回到 2050 这件事情:为什么说这个世界是年青人的?因为当技术非常快速发展的时候,你的学习能力变得非常的重要,很多时候你的经验反而变得没有那么的重要,而是说我要能够更快速的去看到、去发现、去尝试、去试错、去迭代,然后我跟上了这些新技术的发展,我变成了新技术的引领者。我们团队最早的一批人,其实都是以前搞竞赛的,然后我们这批人其实坦白讲,做计算机视觉经验其实都不太行,但是我们学的很快。

所以这个时候其实要的就是一批年青人,他们拥有非常快的学习能力,非常强的动手能力,然后在这样的一个过程中去定义了一些新的事物。

Q:你觉得在 2050 这个事情上,你现在最需要什么协助?

我觉得让更多的人看到 2050,然后也欢迎更多朋友能够加入进来,我觉得这是我们需要的协助!



技术创新 VS 商业创新,中国下一个 10 年的创业机会是什么?为什么说做技术管理必须有点产品思维?如何引进人才组建一个健康可持续的团队?技术规划和选型如何合理化?美团的运营是怎么做的……

迅雷创始人程浩、著名产品人梁宁、苏宁易购 IT总部执行副总裁乔新亮、阿里巴巴钉钉 CEO 无招、拥有 17 年互联网人力资源从业经历的 Tina Jiang 等 20 位领域大咖现场教你做优秀技术 leader,500 位技术高管邀你共赴 GTLC全球技术领导力峰会。


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/V15EzCFKIw
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/12084
 
433 次点击