首页 > 人形机器人革命:2025 GTC大会顶尖技术领袖的深度对话

人形机器人革命:2025 GTC大会顶尖技术领袖的深度对话

在2025年的英伟达GTC大会上,一场围绕人形机器人行业的技术圆桌引发全球关注。波士顿动力CTO Aaron Saunders、1X创始人Bernt Bornich、Skild AI创始人Deepak Pathak、英伟达首席科学家Jim Fan、Agility Robotics CTO Pras Velagapudi等五位行业领袖齐聚一堂,从技术突破..

在2025年的英伟达GTC大会上,一场围绕人形机器人行业的技术圆桌引发全球关注。波士顿动力CTO Aaron Saunders、1X创始人Bernt Bornich、Skild AI创始人Deepak Pathak、英伟达首席科学家Jim Fan、Agility Robotics CTO Pras Velagapudi等五位行业领袖齐聚一堂,从技术突破、硬件瓶颈到未来图景,展开了长达三小时的激烈碰撞。这场对话不仅揭示了机器人技术突飞猛进的核心密码,更勾勒出未来十年人机共生的清晰路径。

图片来源:2025英伟达GTC

机器人***的三大引擎:模型、数据与硬件的协同进化

-突破莫拉维克悖论的技术密码

英伟达科学家Jim Fan开场便抛出机器人领域的根本矛盾:人类轻松的动作对机器难如登天,这种反直觉的莫拉维克悖论曾让行业停滞数十年。他指出了三重突破:

多模态大模型:GPT系列展现的推理能力与视觉-语言-动作的跨模态融合,使机器首次具备理解物理世界的基础认知。当机器人能像人类般感知三维空间中的物体关系时,通用性的大门才真正开启。

数据生成***:通过GPU加速仿真技术,过去需要10年积累的训练数据如今仅需3小时即可生成。英伟达Omniverse平台已实现每秒数万次的物理仿真,为机器人构建了指数级进化的训练场。

硬件平民化浪潮:2025年人形机器人成本已降至4万美元,相比NASA 2001年150万美元的Robonaut,成本下降97%。特斯拉Optimus、Agility Digit等产品的大规模量产,标志着硬件进入汽车级普及阶段。

-从实验室到现实世界的桥梁

波士顿动力CTO Aaron Saunders补充了关键视角:过去十年消费电子的溢出效应,让微型传感器、高密度电池等核心部件成本下降90%。现在一个机器人手掌的算力,已超过2010年整台Atlas的计算能力。他展示的最新Atlas V3机器人,其全身分布的32个微型摄像头和触觉传感器网络,正是消费电子微型化技术的集大成者。该机型在北极科考测试中,能在-40℃环境下连续工作8小时,电池能量密度达到400Wh/kg,远超特斯拉4680电池的300Wh/kg水平。

Skild AI创始人Deepak Pathak则从认知维度突破:传统机器人依赖工程师编程每个动作,就像教婴儿微积分才能走路。现在我们转向类人的经验学习——让机器通过数亿次试错自主进化运动策略。其团队开发的自我监督学习框架,已实现机器人仅凭视觉输入自主掌握复杂地形行走。在DARPA挑战赛中,搭载该系统的机器人以97%的成功率通过碎石滩、倾斜钢板等极端地形,远超传统控制算法的63%。

基础模型的爆发式增长:构建通用大脑的范式***

-简单性与复杂性的哲学统一

Jim Fan在新增讨论中揭示了基础模型的设计奥秘:ChatGPT的成功在于极简主义——将文本到文本的映射统一所有任务。机器人领域需要同样的范式***。他提出的GR00T数据金字塔体系包含三个层级:

塔尖:通过远程操作收集的真实物理交互数据(仅占总量0.1%),如Agility Robotics在亚马逊仓库采集的200万次搬运动作,涵盖从3kg纸箱到50kg金属部件的全重量谱系;

中层:基于Isaac物理引擎生成的仿真数据(占比30%),英伟达已实现每秒生成10万个机器人跌倒-爬起的动态场景,其摩擦系数随机化范围达到±15%;

基座:互联网多模态数据(占比69.9%),通过视频生成模型预测物理轨迹。例如用Sora生成的人形机器人攀岩视频,其力学精度已通过NASA验证,轨迹预测误差小于2厘米。

-数据多样性的新边疆

1X创始人Bernt Bornich以诗歌训练为例警示:单一领域数据训练只会制造专业白痴。我们让Eve机器人同时学习擦窗、插花、修理电路,看似无关的任务反而提升其通用性。其团队发现,当训练数据包含30%的噪音动作(如错误抓取后调整)时,策略鲁棒性提升53%。在家庭环境测试中,Eve处理突发状况(如宠物干扰)的成功率从38%跃升至82%。

波士顿动力则采取保守策略。Aaron Saunders透露:Atlas的学习数据必须通过安全审查委员会审核,任何可能导致危险动作的场景都会被标记隔离。我们正在开发安全蒸馏技术,在保持多样性的同时剔除0.01%的高危数据。该技术使Atlas在建筑工地测试中,工具掉落事故率控制在0.05次/千小时,接近人类工人的0.03次水平。

-人类数据的生物启发

Skild AI创始人Deepak Pathak提出颠覆性观点:70亿人类本身就是生物机器人。我们正在构建神经映射协议,将人类运动皮层的电信号转化为机器人控制指令。其团队通过脑机接口采集的1000小时人体运动数据,使机器人灵巧手抓握精度提升至0.1毫米级。在精密装配测试中,机器人成功将直径0.5mm的轴承装入微型电机,耗时仅2.3秒,超越人类技师的3.1秒纪录。

Agility Robotics的Pras Velagapudi补充硬件视角:优秀的人形硬件应具备拟人惯性——Digit的关节阻尼曲线完全复刻人体生物力学特征。这使得远程操作员仅需2小时就能适应机械身体,实现人机运动映射。在仓储场景中,操作员通过VR设备控制Digit完成货物堆叠,效率达到人工的1.7倍,错误率降低至0.8%。

硬件的阿喀琉斯之踵:规模化生产中的隐秘战争

-个体差异性的终极挑战

Agility Robotics CTO Pras Velagapudi抛出一个尖锐问题:即便同型号机器人,每台的运动学参数都有0.5%的天然偏差。当部署量从百台跃升至万台时,这种微观差异会引发系统性崩溃。其团队通过数字孪生校准系统,为每台Digit机器人建立独有动力学档案,使新策略的跨机型迁移成功率提升至98%。在福特工厂的实测中,100台Digit执行相同装配任务时,动作同步误差小于0.2毫米。

波士顿动力则采取不同路径。Aaron Saunders透露:我们为每台Atlas配备自诊断模块,实时监测1500个机械参数。当检测到关节磨损时,系统会自动调整控制策略补偿性能衰减。这种动态适应的能力,使得波士顿动力机器人在北极科考中连续工作2000小时后,关节扭矩输出仍能保持设计值的99.3%。

-开放生态 vs 垂直整合的路线之争

Skild AI创始人Deepak Pathak提出颠覆性观点:机器人需要类似CUDA的通用中间层。就像AMD显卡能运行英伟达代码,不同品牌机器人应共享统一的智能架构。其团队开发的Neurokernel系统,已在20种异构机器人平台上实现策略迁移,验证了通用大脑的可能性。在跨平台测试中,同一抓取算法在工业机械臂、人形机器手、柔性夹爪上的平均成功率差异小于5%。

1X创始人Bernt Bornich却坚持垂直路线:每个机器人都是独特的生命体。我们为Eve机器人构建记忆网络,让它持续学习自身机械特性。这种个体化学习使Eve在3个月内将抓取成功率从52%提升至89%,但代价是硬件-软件的深度耦合。其专用芯片组的功耗达到45W,是通用方案的3倍。

-物理世界的幻觉难题

关于机器人是否会产生类似LLM的幻觉,现场爆发激烈争论。Deepak Pathak坚持物理交互消灭幻觉,而Pras Velagapudi则以Agility机器人的真实事故反驳:当Digit误判门框高度时,其生成的轨迹就是物理世界的幻觉。在物流中心测试中,这种空间错觉导致2%的货架碰撞事故。Bernt Bornich则用幽默案例调和:我们的Eve机器人曾执着地反复关闭已盖好的马桶圈——这说明它确实产生了对完美状态的执念。其团队通过引入触觉反馈闭环,将此类误操作率从15%降至1.2%。

未来图景:从工具到伙伴的范式迁移

-3-5年内的确定性突破

专业机器人爆发:Agility Robotics已向亚马逊交付3000台Digit机器人,承担仓库搬运、货架巡检等12项任务,效率较人类提升40%,人力成本降低57%。

家庭服务***:1X的Eve机器人开始进入高端家庭,其端茶递物、整理房间的成功率达91%,月租金降至999美元。在东京银座的高端公寓项目中,Eve的入住率达到73%。

人机协作范式:英伟达GR00T平台支持多机器人协同作业,在宝马工厂实现10台机器人+1名监工替代传统20人班组,生产节拍时间缩短22%,缺陷率下降至0.05%。

-跨实体化的终极挑战

Jim Fan展示了震撼实验:我们让同一AI模型同时操控1000种形态各异的仿真机器人——从蜘蛛型到蛇型机械体。通过身体标记化技术,模型学会将任意机械结构转化为可理解的参数序列。这项名为MetaMorph的技术,已实现新机器人策略的零样本迁移,为通用智能奠定基础。在火星地貌模拟测试中,同一算法控制的多形态机器人团队,勘探效率达到单一机型的3.8倍。

波士顿动力则从生物拟态突破。Aaron Saunders透露:新版Atlas的三指机械手看似倒退,实则暗藏玄机——其触觉反馈频率达1kHz,能感知0.1牛頓的力度变化。人类操作员通过触觉手套,可精确感知机械手抓握鸡蛋的微观形变。在生鲜分拣测试中,该机械手成功分拣草莓的成功率达到99.7%,破损率仅0.03%。

-十年周期的颠覆性变革

Jim Fan描绘了震撼蓝图:当机器人学会自我复制时,我们将见证指数级进化。就像AlphaFold颠覆生物制药,机器人科学家将把药物研发周期从10年压缩到1年。他预测2035年前会出现首个自主机器人实验室,能7×24小时进行百万级实验迭代。在概念验证中,机器人化学家已自主发现2种新型催化剂,效率是传统方法的170倍。

-社会接受度的隐形门槛

波士顿动力CTO发出警示:技术成熟度与社会接受度存在代际差。当机器人开始进入养老院照顾老人时,我们需要建立比自动驾驶更严苛的伦理框架。其团队正在开发透明决策系统,让机器人的每个动作都可追溯解释。在日本养老院试点中,该系统使老人对机器人的信任度从41%提升至79%,但仍有23%的受访者表示无法接受机械护理。

结语:站在奇点门前的人类抉择

圆桌以Deepak Pathak的哲学思考收尾:当机器人能24小时学习进化时,它们的童年期可能比人类缩短100倍。我们正在创造一种既像工具又像生命的新物种。此刻,技术领袖们达成的最大共识是:机器人***不是替代人类,而是扩展人类能力的边界。正如Jim Fan所说:我们这代人注定要回答图灵83年前提出的终极命题——当机器获得身体,智能将如何重新定义存在?

这场对话揭示了一个清晰的技术演进图谱:2025-2028年是专业机器人规模化落地期,2028-2030年迎来通用机器人临界点,2030年后将进入人机共生的深水区。从基础模型的进化到硬件生态的裂变,从数据多样性的探索到社会伦理的重构,这场静默的***正在重塑人类对智能与存在的终极认知。

来源:盖世汽车

微信分享

微信分享二维码

扫描二维码分享到微信或朋友圈

链接已复制