有消息认为,该人形机器人跑酷,同样采取了类似强化学习方法,主要通过将 soft 动态约束的强化学习预训练经过具有 hard 动态约束的强化学习微调,最后蒸馏成一个基于视觉的跑酷策略,并以自我为中心的(egocentric)深度相机将其迁移到机器人上,从而才能不使用动作捕捉、激光雷达、多个深度摄像头和大量计算,低成本在人形机器人上部署。
MARS Lab多模态学习实验室是清华大学交叉信息院下的交叉学科人工智能实验室,由赵行教授组建和指导。赵行老师博士毕业于MIT,谷歌无人驾驶Waymo科学家,后加入清华大学任教。MARS Lab研究成果有广泛的学术、社会和产业影响力:学术论文曾获CoRL最佳系统论文入围,ICCP最佳论文奖;多模态学习相关成果在全球多个科技博物馆陈列展出