编辑丨李梦佳导读:设想一下,现在我们要建造一种工厂机器人,能移动物体、组装零件、抬起物体。机器学习专家自然会采用深度学习、神经网络一类的AI技术;而另一类专家则会使用可执行规范(Executable Specification,例如:规则、流程图、方案、过程代码),即传统的建模技术。虽然作为主流范式的机器学习大行其道,但人工智能系统的可验证性、可解释性也存在一定的挑战。相较之下,基于状态机、编码、场景的传统建模技术却可以高效、鲁棒地完成一些深度学习系统不擅长的任务。而以色列科学与人文科学院院长、智源学术顾问 David Harel 教授认为,我们应该将人工智能与传统建模技术融合起来,使二者互为补充。2022 年 1月 18 日,David 教授带来了题为「Combining Modeling and AI: Enhancing Deep Learning with Classical Specifications」的报告,对比了机器学习与传统建模方法各自存在的优势和不足,介绍了将二者结合的方法论,举例说明了如何将这种融合方法应用于网络拥塞控制,并为该领域未来的发展指出了方向。本文整理自智源大师讲座,视频回看地址(或点击阅读原文):https://event.baai.ac.cn/activities/232
1 机器学习 V.S 传统建模假设我们要建造能够移动物体、组装零件、抬起物体等动作的工厂机器人。为此,机器学习专家希望只使用人工智能技术(例如:深度学习、神经网络、规划);而另一类专家希望只使用可执行规范(Executable Specification,例如:规则、流程图、方案、过程代码),即传统的建模技术。这两类专家都可以很好地做出工程原型,但是监管机构和安全专家并不相信机器学习给出的结论始终正确,他们很难验证其性能;同时,专家认为传统建模方法过于简单,它们使用了很多假设分支结构,无法处理一些随机出现的特殊问题。此外,对这两类方法进行新的测试都十分困难,其经济成本十分高昂,也十分耗时。David Harel 教授认为,我们应该将人工智能与传统建模技术融合起来,使二者互为补充。例如,在建造一个自动驾驶汽车时,我们可以训练一个神经网络来识别交通信号和车道线,而在识别出红绿灯信号后,通过传统建模(编码)的方式为系统设定可以进行的动作则相较于训练 AI 模型完成这些动作更加简单。目前,深度学习和经典建模技术的前沿进展差别很大,但它们可以很好地互补。如上图所示,深度学习擅长完成一些难以详细指定、但人类可以很轻易地完成的认知任务,而经典的建模技术却难以胜任这类任务。人们曾尝试通过规则来识别交通标志,但是光照、观测角度等因素的变化使该任务变得十分困难。传统的反应式系统(银行取款机、电子表、航空器等)涉及对各种事件的反应,事件之间也存在复杂的影响,经典建模方式在这些方面取得了成功,而如何通过人工智能技术针对此类任务进行相应的规划还有待探索。如今,如何更好地将领域的专家知识和表征引入深度学习系统是有待研究的课题,而使用经典建模方式则需要领域专家告诉系统何时应该/不应该做什么,有时这是很有意义的。最重要的一点是,深度学习模型是「黑盒」,我们很难验证深度学习模型输出的结果符合我们的期望,因此研究如何验证人工智能系统的输出是目前一个十分火热的研究领域。另一方面,我们可以对状态机、编码、规则等传统建模技术的结果进行验证,尽管验证的过程往往较为复杂。此外,深度学习的内在工作机理还有待探索,有时我们并不知道此类模型为何会得到相应的结果,深度学习模型的「可解释性」成为了一个重要的研究课题。而当我们使用传统建模方法时,可以清晰地观察到系统在运行过程中每一步上变量的变化、输出的结果,从而为最终得到的结果提供解释。