Py学习  »  aigc

从AI CICERO说起,为AIGC增加意图判别模块

混沌巡洋舰 • 4 月前 • 74 次点击  

chatGPT的大热,让聊天机器人成功出圈,然而对话机器人能否识别与之交谈者的意图,并通过话术改变他人的意图,最终让人们能够达成合作,却任然是未知的。Meta推出的AI CiCERO(致敬古希腊外交家西塞罗),首次在受控环境下,证明AI具有了和人类谈判的能力。

 

 

不同于象棋,AI CiCERO面对的桌游”强权外交“中共有7名玩家,玩家每回合开始前可以在公共频道交流,合纵连横。在这样的环境下,若AI无法沟通,本身的策略再优秀也无法获胜。而AI CiCERO之所以能够于在线游戏平台匿名取得超过人类玩家平均分的2倍,并且最终排名为前10%。不仅在于其对话机器人能够以假乱真,让82名人类玩家在40场游戏中,都没有怀疑过它其实是个AI,还在于其能够识别出玩家对话中的动机,针对性地制定自己的话术策略。

 

AI CiCERO 核心是由一个对话引擎和一个战略推理引擎共同驱动的,战略推理引擎是经由自我博弈加强化学习训练得出,而对话引擎来自2.7亿个参数的BART模型。经过对当前局势的预判,形成当前要达成的目标,之后过滤和玩家对话过程中的无意义语句,基于新信息改变对当前局势的预判,最终基于对局势的预判,从多个回复语句中选出高质量的输出,用以和人类交流。

 

看完AI CiCERO的论文,笔者觉得这样的AI,还可以进一步扩展,例如通过改变战略推理引擎对当前局势的估值函数,让AI玩家具有不同的性格,例如有些玩家是风险偏好型的,有些则不愿冒险;又比如在游戏中,玩家可以制定合约后选择不去遵守,目前AI也会这样做,但通过设定AI的性格,可以促使某些AI选择惩罚那些欺骗者,即使这样并不能让自己获利。这样形成的AI,会更接近元宇宙中的虚拟人物,可以设定个性,甚至还可以允许虚拟任务在互动中改变性格,例如在多次和玩家的互动中遭到背叛后,开始惩罚那些曾经背叛的玩家。

 

在AIGC中,加入对话者的意图判别模块,还可能有更多全新的应用场景。例如当前AI的对话,还接近闲聊,而对于AI辩论,如果能够在理解对话者为何发言后,就可以选取与发言意图,而非表面的发言内容更相关的内容给出回复。更进一步,还可以让AI之间相互辩论,例如设定AI具有不同的知识背景和性格,这样生成的对话,对于用户来说,可以起到兼听则明的效果,例如用户在高考报志愿时,可以在元宇宙中生成几个不同性格和角色,让其通过对话来展现内心小剧场中的声音。而这样的应用,需要AIGC能理解对话的意图不是泛泛地谈论不同专业的差别和前景,而是要针对特定的个体进行分析,这就可以借鉴AI CICERO中的意图判别和语句过滤模块。类似的应用场景,还包括职业选择(例如该接受那个offer),或者针对特定企业的模拟董事会(让一个AI代理专门提反对意见,以避免公司的决策失误)

 

 

 

链接:https://www.science.org/doi/10.1126/science.ade9097


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/181799
 
74 次点击