当模型可以实时理解狗狗的行为后,我们开始确定所期待的狗狗回应,以进一步建立互动。我们的设备装有零食投喂机、灯光和扬声器,可以通过声音和视觉信号与狗狗交互,并奖励狗狗零食。Companion 采用基于奖励的正强化训练机制:只要狗狗做出了符合我们期望的动作,设备就会提供奖励,从而提升此行为的频率。
这些步骤与训犬师采取的步骤相同。想象一下,我们正试着教狗狗在听到“坐下”时坐下。第一步是让狗狗适应 CompanionPro 设备,设备首先会无条件地给狗狗投喂零食。当狗狗的监护人确定狗狗对设备适应良好时就可以离开房间,让狗狗与设备自主互动。截至目前,我们与救助站和日托机构的数百只狗狗一起工作,已让其中 95% 以上不同品种和年龄的狗狗适应了我们的 CompanionPro 设备。
在整个训练过程中,设备将通过寻找表示狗狗舒适并渴望互动的迹象,始终确保狗狗愿意配合。然后 CompanionPro 会等待狗狗自然坐下,并立即就此行为奖励狗狗。当狗狗开始更频繁地坐下时,设备就会发出“坐下”的指令。CompanionPro 使用适应性学习方法,可以延长狗狗坐着的持续时间,从而开始形成“定住”的行为。通过多次训练,我们可以逐渐将“坐下不动”的持续时间从不到一秒延长到数分钟。狗狗接受了多种行为训练,经历了多次这一过程后,我们就可以开始跟狗狗玩游戏,在一次训练中发出多个行为口令,从而加深狗狗对口令的理解。例如,我们可以在“坐下”、“趴下”和“召回”这几个指令间来回切换。
在大型桌面设备 GPU 上运行这一系统,我们已经可以让狗狗参与 CompanionPro 训练。犬类测试的监护人都报告说,他们的狗狗对口令的回应更加迅速,在家里训练时通常也更专注。
SF SPCA 行为诊所治疗的最常治疗的一种症状就是分离焦虑 (Separation Anxiety)。患有分离焦虑 的狗狗在独处时会极度焦虑,在主人离家时还可能大叫、罹患紧张导致的胃肠疾病,或破坏家具。这种疾病很难治疗,因为狗狗只有在独处时(如周围没有人安慰他们)才会表现出症状。Companion 团队与 SF SPCA 行为团队合作,使用 Companion 训练方法在主人离家时与患有分离焦虑的狗狗互动减少焦虑,并测试这一方法的效果。我们的早期结果表明,自动训练方法可能缓解分离焦虑,从而提升狗狗的幸福指数和主人的生活质量。
成功完成训练试验,并且通过早期迹象表明我们的技术可以帮助减轻分离焦虑后,我们确认,自主训练有效果并且可以让狗狗及其主人受益。下一步是将我们的技术应用到可实际用于狗狗产业的产品中。