2021年1月16日下午两点,CHEERS2021湛庐年度大会以在线直播的形式重磅开启。在“面向未来的视野”环节,中国人民大学高瓴人工智能学院长聘副教授,微软小冰前首席科学家宋睿华女士,结合湛庐新书《我们赖以生存的意义》,带来了同名主题演讲。她告诉我们,“思考,以及使用语言的能力,是人类肉身与头脑结合的成果”。认知科学近三十年发展成为主流的体验模拟假说,可以更好的启发我们如何做自然语言理解。
人类的语言理解是多模态的,而不仅仅限于符号层面。心智的奇特之处在于,它喜欢跳跃与留白,会自动补上情节里的“洞”。那些引人入胜的电影,从来都不需要完整镜头的呈现,我们照样可以毫不费力地看懂。或许,这就是所谓的“脑补”。多模态模型有望模拟这种能力,脑补上那些语言中不曾赘述的“洞”。
而近年来,深度学习的盛行正好为AI的多模态语言理解带来曙光。宋睿华合作的团队也在实验中发现,多模态预训练语言模型相比纯文本预训练语言模型,其词向量的关联情况更接近于常识。
宋睿华预言:多模态将是AI开启常识之门的钥匙。