Py学习  »  chatgpt

英伟达GTC机器人产业链更新及专家纪要:推出人形机器人大模型Project GR00T,机器人的ChatGPT时刻即将到来

汽车产业上市公司研究 • 1 月前 • 43 次点击  
事件1: 英伟达黄仁勋在GTC大会推出人形机器人大模型Project GR00T,该项目旨在让人形机器人理解自然语言文本、语音、视频,以模仿人类运动,并与现实世界互动。
该项目还配套了两大支持:①硬件支持:Jetson机器人硬件架构平台已正式接入英伟达最新算力智能芯片Thor雷神。②软件支持:全面升级Isaac Lab机器人平台,用于加强GR00T大模型的端到端网络应用的合作开发和训练效率,并提供了Isaac操纵者和Isaac感知者等机器人预训练模型、库和参考硬件。

GR00T已开展实践合作:GTC大会展示了九个由GR00T驱动的人形机器人,分别来自Figure AI、Agility Robotics、Apptronik、傅利叶智能、宇树科技、1x、Sanctuary AI、波士顿动力、小鹏鹏行。


事件2: 波士顿动力首席技术官在GTC大会中展示了四足机器人SPOT在CHATGPT加持下响应语音命令和回答问题、双足机器人ATLAS利用模型预测控制、零样本泛化方法实现灵活的运动,并且借助强化学习快速迭代。此外,波士顿动力将推出Spot RL研究人员工具包,该工具包会结合波士顿动力与英伟达在各自领域的世界级优势。


昨晚我们与美国某实验室研究员召开电话会议,探讨海外机器人和GTC大会的进展,核心要点如下:
1、GTC大会上最值得关注的核心亮点:1)GPU方面是最首要的变化,Blackwell比之前基于生成式AI的算力提高了5-8倍;2)推出GR00T,脱胎于Issac sim的机器人平台工具,帮助本体厂更快实现复杂的控制规划;3)开发了专门用于机器人大脑的计算芯片Jetson thor,内置了transformer引擎来处理多模态传感器。#机器人的ChatGPT时刻即将到来。
2、大模型的发展最利好的硬件端在于触觉传感器。figure此前发布的视频中并未展示触觉,在一些基础动作规划上还存在缺陷,之后可能需要增强的地方在于(1)增加触觉传感器,(2)同一时间结合多模态信息并进行推理判断。随着大模型发展,未来主要的硬件限制在于手部,#预计未来手指尖端的触觉传感器用量会提升。
3、海内外厂商进展评价与对接国内硬件供应链的可能性展望近期进展比较明显的本体厂主要是figure、宇树、特斯拉、波士顿动力。figure是目前已知的唯一公开用了大模型的厂商,目前基本处于行业第一的水平。国内机器人厂商目前最看好宇树,做了很多全身控制的同时能保持稳定,四足在海外很多研究院所得到应用,具备以极低价格实现量产的能力。波士顿动力创始人公开表示未来在硬件上会考虑跟国内供应链接触,首要的可能是电机、材料等。


【英伟达GTC大会机器人分会纪要

参会者:
英伟达机器人业务高级经理

波士顿动力专家


摘要:

1、 对于机器人而言,采集足够的数据是其难点之一。数字孪生技术可以协助机器人获取大量数据。

2、 目前数字孪生还集中在机器人肢体训练层面,全身训练模式比较少。

3、 大模型已经可以生产很多3D视频与图片,对机器人的训练有很大帮助。

4、 安全性会成为机器人推广的主要门槛,机器人要证明安全性后才能大规模推广。

5、 目前美国在人形机器人AI能力上比较领先,中国在硬件能力上领先。

         

 

Q:波士顿动力公司的发展历程?

A:公司在早期叫Silicon Graphics,早期做了很多很多图形模拟的工作。早期不是有很多客户感兴趣,公司需要不断兜售创意才能活下去。

公司在中途才转向机器人方向,做了很多机器人可以运用在各种场景,后面又开始研究机器人的认知智能、控制系统。

         

 

Q:如何看待扫地机器人、工业机器人这些领域?

A;大多数机器人技术是最近几年才出现的,目前大模型还实现不了和人一样的能力。

波士顿动力是一家数据驱动的公司,公司通过给机器人装配不同的数据采集工具来收集数据,寻找迭代方式。

         

 

Q:如何看待大模型对机器人的影响?

A:采集足够数据是机器人研究的很大难点。之前在做实验的时候,硬件比较容易损坏,每次修理都要花好几天时间,开发者需要特别小心对待硬件。

波士顿动力经常用软件模拟的方式来获取大量数据。把模拟世界和现实世界相结合是最好的方式。

         

 

Q:目前英伟达的数字孪生平台可以很好的模拟刚体世界,但和现实有差距。如何应对模拟数据和现实世界之间的差距?

A:机器人不仅仅要实现最基础的动作控制,还要做到敏捷精准。现在数字孪生只是做到了部分身体的模拟控制,但全身的模拟还很少。

波士顿动力公司有不同的人在负责不同的方向。公司有人在现实世界先收集到足够的数据,在模拟世界中导入,导入后再生产大量虚拟数据。

         

 

Q:如何看待人形机器人的传感器?

A:传感器很重要,但很多东西可以通过基础模型而不是传感器来实现。比如说知道外界环境的材料,不需要传感器而是通过模型推理得到。

         

 

Q:人形机器人的应用场景?

A:波士顿动力现在有1500个人,已经有各种各样的机器人在各种场景中使用,比如说日本福岛核反应堆的检测,以及很多重复性工作的场景,例如汽车制造工厂。    

         

 

Q:大模型对机器人的影响?

A:机器人的和开放世界的交流非常重要,大模型可以让机器人具备推理能力,可以与外界环境交流。

机器人训练有三条途径,分别是现实世界的训练、数字模拟的训练、观看人类在现实世界的视频。

目前AIGC可以直接生产3D的视频,会对机器人行业有很大的促进作用。

         

 

Q:哪家人形机器人公司的技术能力最强?

A:在计算能力方面,美国比较优先。

在建造机器人硬件方面,中国比较领先。中国可能有上百家机器人公司。

         

 

Q:机器人落地最大的限制在哪里?

A:安全性。在人形机器人证明自己足够安全之前,可能只会在部分场景使用。

         

 

Q:工业机器人未来会如何发展?

A:目前工业机器人也在使用AI能力,让他们不仅仅做一些简单重复的动作。AI技术快速提升也会给工业机器人带来很大的催化。

         

 

Q:基础模型对人形机器人的影响?

A:基础模型会提升机器人的认知能力。


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/168231
 
43 次点击