从AI CICERO说起，为AIGC增加意图判别模块

chatGPT的大热，让聊天机器人成功出圈，然而对话机器人能否识别与之交谈者的意图，并通过话术改变他人的意图，最终让人们能够达成合作，却任然是未知的。Meta推出的AI CiCERO（致敬古希腊外交家西塞罗），首次在受控环境下，证明AI具有了和人类谈判的能力。

不同于象棋，AI CiCERO面对的桌游”强权外交“中共有7名玩家，玩家每回合开始前可以在公共频道交流，合纵连横。在这样的环境下，若AI无法沟通，本身的策略再优秀也无法获胜。而AI CiCERO之所以能够于在线游戏平台匿名取得超过人类玩家平均分的2倍，并且最终排名为前10%。不仅在于其对话机器人能够以假乱真，让82名人类玩家在40场游戏中，都没有怀疑过它其实是个AI，还在于其能够识别出玩家对话中的动机，针对性地制定自己的话术策略。

AI CiCERO 核心是由一个对话引擎和一个战略推理引擎共同驱动的，战略推理引擎是经由自我博弈加强化学习训练得出，而对话引擎来自2.7亿个参数的BART模型。经过对当前局势的预判，形成当前要达成的目标，之后过滤和玩家对话过程中的无意义语句，基于新信息改变对当前局势的预判，最终基于对局势的预判，从多个回复语句中选出高质量的输出，用以和人类交流。

看完AI CiCERO的论文，笔者觉得这样的AI，还可以进一步扩展，例如通过改变战略推理引擎对当前局势的估值函数，让AI玩家具有不同的性格，例如有些玩家是风险偏好型的，有些则不愿冒险；又比如在游戏中，玩家可以制定合约后选择不去遵守，目前AI也会这样做，但通过设定AI的性格，可以促使某些AI选择惩罚那些欺骗者，即使这样并不能让自己获利。这样形成的AI，会更接近元宇宙中的虚拟人物，可以设定个性，甚至还可以允许虚拟任务在互动中改变性格，例如在多次和玩家的互动中遭到背叛后，开始惩罚那些曾经背叛的玩家。

在AIGC中，加入对话者的意图判别模块，还可能有更多全新的应用场景。例如当前AI的对话，还接近闲聊，而对于AI辩论，如果能够在理解对话者为何发言后，就可以选取与发言意图，而非表面的发言内容更相关的内容给出回复。更进一步，还可以让AI之间相互辩论，例如设定AI具有不同的知识背景和性格，这样生成的对话，对于用户来说，可以起到兼听则明的效果，例如用户在高考报志愿时，可以在元宇宙中生成几个不同性格和角色，让其通过对话来展现内心小剧场中的声音。而这样的应用，需要AIGC能理解对话的意图不是泛泛地谈论不同专业的差别和前景，而是要针对特定的个体进行分析，这就可以借鉴AI CICERO中的意图判别和语句过滤模块。类似的应用场景，还包括职业选择（例如该接受那个offer），或者针对特定企业的模拟董事会（让一个AI代理专门提反对意见，以避免公司的决策失误）

链接：https://www.science.org/doi/10.1126/science.ade9097