技术引路：机器学习仍大有可为，但方向在哪里？

整理 | CTA 直播小分队

出品 | AI科技大本营（id：rgznai100）

杭州国际博览中心，这里曾经是二十国集团领导人第十一次峰会的主场馆，5 月 26 日 CTA 核心技术与应用峰会（杭州）同样在这里正式召开！

正如 CSDN 谷磊总编在大会开幕词中讲到的，在过去 20 年时间里，CSDN 见证了技术浪潮从 PC互联网到移动互联网、大数据、云计算、人工智能、万物互联的发展阶段，也见证了一代又一代开发者从优秀到卓越的心路历程。在 CSDN 社区，大家开放共享的精神，成为后来者技术精进的阶梯。

本次大会的指导单位工业和信息化部人才交流中心的党委副书记陈新，也在讲话中特别提到数字经济人才聚集区的人才建设问题，将聚焦人工智能、大数据、云计算、物联网、VR/AR等前沿技术。工信部人才交流中心将通过整合国内外专业资源，打造数字经济人才学习交流、创新创业、合作共赢的平台，为当地数字经济产业的发展营造良好的产业发展生态。

随后，大会就进入了全天的技术风暴中，来自阿里巴巴达摩院、腾讯音视频实验室、Hulu 研究院、腾讯优图、滴滴、微博等科技公司的一线技术专家，带来了当下最新的技术成果与解读，为开发者在机器学习的研究与应用之路提供了深度、有价值的意见。接下来，就跟着营长一起回顾今天不可错过的精彩内容。

华先胜：AI技术与应用成功的关键因素是创造价值

阿里达摩院城市大脑实验室负责人华先胜指出，人工智能技术发展“泼了一盆冷水”，然后指出 AI 技术和应用成功的关键因素是创造价值：锦上添花、雪中送炭、无中生有，最后是形成商业价值。

随后，基于阿里在大规模AI应用场景的基础，他从视觉智能、视觉智造、视觉诊断和城市大脑四个层面具体讲述了以机器视觉为主的技术应用案例。以视觉搜索为例，其中的关键技术是特征学习以及索引和搜索系统，从其应用中得到启发是视觉搜索应该关注核心需求：技术至上vs应用先行、刚性需求vs锦上添花、用户先行vs数据先行。

而视觉智造的主要应用有视觉编辑（比如广告植入）、自动平面设计等。对此，他给出了实践经验：要创造一个需求（不只是来自设计师），只和行业顶尖高手合作，另外，要先关注刚性需求，而不是炫酷的技术，要用商业创新反哺技术创新。

最后，他总结了对人工智能技术实践的看法。第一，人工智能发展势不可当，进展迅猛，局限巨大，无行业不 AI；第二，不深入行业，就没有深度的AI，AI+算力+数据等于价值，要首先看到价值到底是什么；第三，人工智能发展机会非常多，要用AI做人力所不能及的事情，要让AI服务于人。

高孟平：音视频领域应用落地广泛，未来挑战同样艰巨

腾讯音视频实验室专家研究员高孟平讲述了腾讯音视频实验室的多模态机器学习技术在人眼视觉服务中的落地情况。他表示，在视频服务里有几个重要的环节，如视频理解、处理、编辑、质量评估。利用深度学习等AI技术、基于人眼视觉标准的端到端视频处理平台，在视频理解、视频处理、质量评估等三个方向有非常深入的研究。

随后，高孟平从视频、音频、图像三方面分别讲述了智能封面的架构。关于未来的工作与挑战，高孟平举了两个例子进行说明。一是 Semi-Reference Architecture，二是使用图像美学（Image Aesthetics）的通用模型，因为有些内容是无法用精彩视频描述的，如QQ音乐、K歌等，没有特定的动作。如果直接透过图像美学的评价，不用精彩视频，或许也是一个好的解决办法。

谢晓辉：推动 AI 认知，解决语义的鸿沟，需要借助知识图谱等技术

Hulu首席研究主管谢晓辉分享了视频理解在个性化推荐与内容发现中的应用，内容涉及视频理解在内容冷启动、视频精细化标签和分组、深度推荐模型中的应用等。

随后在 Panel 环节中他还提到，所有在 AI 领域深耕的人，包括 Hulu，都会发现语义的鸿沟仍然是一个非常具有挑战性的问题，这最终还需要借助知识图谱等技术，来帮助整个AI认知取得新进展。

彭靖田：TensorFlow 2.0 力图实现普惠 AI

谷歌机器学习专家彭靖田以《TensorFlow 2.0实现AI大众化》为题进行了演讲。他为大家分享到：TensorFlow 2.0 力图打造易于上手、性能强劲和灵活通用的端到端机器学习平台。通过 tf.keras 定义的高层次机器学习 API，用户可以快速验证模型效果、一键实现分布式训练、跨平台部署模型等。未来，TensorFlow 社区将持续提升用户体验，真正实现普惠 AI。

彭湃：让 AI 更有温度，“科技向善”也是使命之一

腾讯优图实验室高级研究员彭湃为大家讲述了内容审核工作中 AI CV算法的实践与应用。AI 出现之前内容审核的方式都是人工审核，人工审核一百张违规照片需要 12 分钟左右，如果是 AI，只需要 1 秒钟。而 AI 审核模型是通过深度卷积神经网络实现的，从实际业务场景中探索出双模型级联合结构——DeepEye。数据是核心弹药，如何构建符合实际需要，性价比高的数据？采用主动学习机制进行数据积累，通过数据引擎挑选出值得标注的数据。

如何把网络模型 ResNet-152 变为 ResNet-50，效率提升 2 倍，精度损失降低于 1%？在性能优化工作中设计了 Deepsmart 高效模型，采用知识蒸馏兼顾大模型效果与小模型的效率，以及有助于提升模型鲁棒性的数据扩增工作。20年后的今天，AI 带来这么多的技术的升级，“科技向善”也是 AI 的使命之一，我们 AI 从业者需要有更多的社会责任感和担当，让AI更有温度，科技向善，以人为本。

谢迪：动态恒常性是深度学习模型优化和稳定性的核心

海康威视研究院前沿技术部负责人、资深算法专家谢迪讲述了团队在完善机器学习流水线上的实践，包括信息生成（Annotation）、模型训练（Train）以及部署（Deployment）。通过分析信息初始化方法（即静态恒常性和动态恒常性）的一些特点和优势，可以得知：训练一个真正的深度网络，批量标准化是必要条件；二动态恒常性相比静态恒常性更为重要；三是相较于单个方向保持动态恒常性，在训练时保持两个方向同时保持动态恒常性，才是解决问题的关键；四是如果模型非常深，可能还需要显示对传播的信号进行调控调试。

最后，谢迪还总结了四点看法：一是在目前的深度学习框架中，模型对信息生成方式是非常敏感的；二是需要找到超越Bounding Box的更加优雅的表示方式；三是训练神经网络时，一个非常关键的因素是动态恒常性（Dynamic isometry ），它是深度学习模型优化和稳定性的核心；四是可能还需要显式对传播信号进行调制。

齐彦杰：决定 Push 效果的背后机制——博文质量、算法模型与分发效率

微博研发中心技术专家齐彦杰分享了微博基于机器学习在个性化 Push 任务中的实践与应用。微博的 Push 任务有基于热点、人物关系、地理区域、个性化信息等多种类型，齐彦杰特别针对个性化 Push 场景下的技术实践与应用、打通链路的关键技术做了详细解读。

4.6 亿 MAU 的微博是如何进行用户增长的？这不得不提个性化 Push 任务。而决定 Push 效果的背后机制则主要是博文质量、算法模型与分发效率三方面。机器学习架构自底至上主要包括基础数据、特征工程、模型服务于排序策略四层。在此架构之后，还有一个重要的技术环节——构建推荐系统，最后，通过兴趣、实时、关系与环境四个维度构建特征体系，选择拟合与用户之间的关系模型，无论是早期的 LR 模型、还是 FM 模型、wide&deep 模型我们都进行过尝试，而样本数量在其中发挥着不可忽视的作用。

熊超：对话问答通过图灵测试还有很长一段路要走

滴滴 AI Labs NLP 智能对话团队负责人熊超在分享中讲到，对话问答领域面临的最大的挑战就是图灵测试，目前的多轮对话能很好的回复问题，但并不表示完全理解了用户背后真正的意图，想要顺畅的解决特定领域的对话任务还需更长时间。

圆桌讨论：AI 如何助力认知能力，提升业务水平？

数字化信息时代，虽然所有行业都在进行数字信息化，但是却没有将其真正利用。借助深度学习的快速发展，现在大家开始试图借助 AI 技术理解真实世界。”如何利用 AI 算法认知世界“就成为了核心问题。在本次 Panel 中，各位嘉宾就将围绕这个核心问题，并结合实际的业务场景中，为大家分享 AI 技术如何赋能与真实落地场景？又面临着哪些挑战？

营长特意将圆桌讨论中每位嘉宾的精彩观点进行了摘录：

谢晓辉：所有在 AI 领域深耕的人，包括 Hulu，都会发现语义的鸿沟仍然是一个非常具有挑战性的问题。做标签会发现标签距离最终产品想要的标签，二者间语义的鸿沟很大的。最终都要借助知识图谱等技术，帮助整个 AI 认知取得下一步的进展。过去几年，AI 像脱疆的野马，快速奔跑，无论是否逼进峰值，技术的快速发展都给产业落地留下了广阔空间，未来仍大有可为！

齐彦杰：推荐系统构建于认知层之上。如何基于多模态信息理解用户是当下的一个挑战。业内现在不仅会分析文本内容，图像内容，视频内容理解也成为技术热点。当前技术飞速发展，技术团队需要随着发展做出调整，提高效率，让技术更好地落地。同时，需要知道自身数据和哪些新技术契合，才能够更高效的提升自己的业务，不被淹没在新技术的海洋之中。

高孟平：我的业务中更多的关注于视频本身的理解，如标签或者高阶语义的理解。技术进展也推动了应用的发展，提供了问题的解决方案，但是很多仍存在挑战，还有很多无法解决，如质量评估。我们的解决的思路是：先定位问题，然后寻找 AI 的解决方法，最后通过业务利用客观指标反映技术的提升效果。如果只是在某个领域里不断刷新指标，反而可能错失新领域的应用机会。

熊超：我们现在做的是智能客服，在对话问答领域面临的最大的挑战就是图灵测试，尤其是在对话非常丰富的情况下，更是一项艰巨的任务。能很好的回复问题，但并不表示完全理解了用户背后真正的意图。其次，想要顺畅的解决特定领域的对话任务还需要一个质的飞跃，也许几年、十年甚至更长的时间。

彭湃：首先，内容审核业务面临的一个非常大的挑战就是：不同的客户，因其业务的形态不同，需要过滤的规则边界也会有所差异。其次，从 To C 产品到现在助力产业互联网，会服务不同的产业客户、面临不同的需求，而这些是否都是 AI 可以解决的问题，是需要思考的。20年后的今天，AI 带来这么多的技术的升级，"科技向善"也是 AI 的使命之一，我们AI从业者需要有更多的社会责任感和担当，让AI更有温度，科技向善，以人为本。

正如谢晓辉所总结的：“未来，机器学习技术仍具有广阔的空间，大有可为”，这并不是一句简单的鼓舞人心的话语，而是在各行业技术专家、各行业的技术落地等综合考量下，深入机器学习领域本身，对未来给予的厚望。今日暴露的短板正是明日奋勇前进的方向，也更是证明了，作为中国开发者，我们想做的、能做的还很多！

最后，再次奉上本次大会官方链接，一键获取大会活动详情及部分嘉宾演讲PPT：

https://bss.csdn.net/m/topic/cta_meet/index#

（*本文为 AI科技大本营原创文章，转载请联系微信1092722531）

◆

CTA核心技术及应用峰会

◆

5月25-27日，由中国IT社区CSDN与数字经济人才发展中心联合主办的第一届CTA核心技术及应用峰会将在杭州国际博览中心隆重召开，峰会将围绕人工智能领域，邀请技术领航者，与开发者共同探讨机器学习和知识图谱的前沿研究及应用。

更多重磅嘉宾请识别海报二维码查看。CTA 主会议已经开始，第二日论坛少量余票即将售罄，欢迎点击阅读原文购票参会！更多详细信息15101014297，备注“CTA”，了解票务以及会务详情。

推荐阅读

点击阅读原文，了解「CTA核心技术及应用峰会」