C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

亚星游戏官网-yaxin222  上尉

注册:2010-4-2810
发表于 2025-4-21 09:06:56 |显示全部楼层

人形机器人在过去50多年中的“迟缓发育”,像极了曾经的 AI。

深度学习的概念也早在几十年前就诞生了,但直到 2009 年斯坦福教授李飞飞发布图像数据集 ImageNet,科学家们意识到数据对于算法的重要性,深度学习才拉开了变革与飞速发展的序幕。

亚星游戏官网-yaxin222


而在具身智能领域,人们同样在试图创造“ImageNet时刻”。近几年,业界多次喊出“ImageNet时刻来了”,但都没能真实地加速整个行业的发展。没有高质量的训练数据,具身智能的ChatGPT时刻、苹果时刻——也就是产品的突破点,就还远未触及。

要解决数据问题,科研院校、政府机构、服务商、本体厂商等都在其中扮演着重要角色。

开源数据集:聚流成海

在 ChatGPT 横空出世后,科学家们意识到数据的“大力出奇迹”法则还是很有用的。假如每家机器人、甚至每款机器人的每个场景都单独用一套数据、训练一套模型,具身智能的进展显然会缓慢得多。

亚星游戏官网-yaxin222


2023 年 10 月,GOOGLE DeepMind 联合 21 个机构收集了 22 个不同类型机器人的数据,并开源了这一数据集 Open X-Embodiment。

这个数据集包含 527 种技能(对应 16 万个任务),100 多万条真实机器人轨迹。DeepMind 还在此数据集上训练了通用机器人模型 RT-X。

但 Open X-Embodiment 是由 60 个已有机器人数据集构建起来的,其中的子数据集在数据格式、数据质量和场景多样性上都参差不齐,不是特别“好用”。紧接其后,国内外许多机构也纷纷开源了自己的具身智能数据集。

2024年8月,深圳的鹏城实验室联合南方科技大学、中山大学发布并开源了数据集 ARIO(All Robots In One)。ARIO 有一套针对具身大数据的标准格式,包含 258 个场景序列、32 万个任务、300 万个样例,在数据统一、数据质量、数据规模、场景丰富度上又向前迈进了一步。

亚星游戏官网-yaxin222


南方的研究机构发力了,北方也不甘落后。由优必选、京城机电、小米机器人、亦庄机器人等单位联合组建的国地共建具身智能机器人创新中心(位于北京),也联合北京大学、智源研究院等机构发布了开源数据集 RoboMIND。

除了这些科研机构,业内领先的机器人厂商也为开源数据贡献了力量。

2024年12月,由“天才少年稚晖君”创立的智元机器人发布了开源数据集 AgiBot World,数据来自100个机器人的100多万条轨迹,覆盖了5大领域的百余个真实场景。由于数据全部来源于智元机器人在数千平米训练场里的真机操作,该数据集拥有超高的数据质量和数据统一性—— 一个对比是,ARIO 中的数据有较大部分来自开源和仿真。

此外,AgiBot World 有近 90% 的任务为 30s 以上的“长程任务”,不少是由多个动作组合而来的“复杂任务”,而 Open X-Embodiment 则有 78% 是 5s 以内的简单任务。AgiBot World 的场景范围也扩大至家居、餐饮、工业、商超、办公等,而不局限于实验室环境。

亚星游戏官网-yaxin222


2025年2月25日,智元机器人进一步开源了 AgiBot Digital World 仿真数据集。

和智元机器人一样,宇树机器人也开源了其 G1 机器人操作数据集。

数据对于具身智能的训练至关重要,但是否开源则是各家厂商不同的选择。像波士顿动力的 Atlas,以及特斯拉的 Optimus,它们的数据和代码就从未公开。

和大语言模型拥有互联网上“取之不尽”的庞大训练数据相比,具身智能的几百万条开源数据就显得微不足道了。但总归是聚流成海,各个研究机构和科技厂商的开源数据集还是非常有价值且不可或缺的。

真机训练:再贵的学费也得交

在真实的环境里进行真机训练,仍然是具身智能获取数据的重要来源。

上一集大家聊到过,人形机器人真机训练主要靠人类动作捕捉和人类遥操作。而在每个领域和环节都诞生了不少服务商,成为这场“淘金热”中的“卖铲人”。

亚星游戏官网-yaxin222


诺亦腾是一家动作捕捉企业,前十来年的业务都在影片特效、游戏交互、运动科学、虚拟主播(数字人)、VR等方向上。2023 年下半年开始,随着具身智能热度不断提升,来自机器人领域的合作随之激增,诺亦腾合作过的本体厂商包括智元机器人、千寻智能、Tokyo Robotics 等。

在机器人遥操作领域,最重要的是通过算法的优化减少“Sim2Real Gap”,让人类的动作更好地映射到机器人本体上。这也是动捕厂商和本体厂商需要共同磨合和训练的地方。

例如,诺亦腾和智元机器人共同优化了惯性动作捕捉算法;而机器视觉企业凌云光则与宇数科技共同研发了光学动作捕捉系统 FZMotion,能够精准捕捉人体姿态和运动轨迹并直接映射到宇树 H1 机器人本体上—— H1 在春晚上甩手绢的舞蹈,很可能就是用这套算法训练的。

在本体动捕和遥操作之外,还有一些服务商专门提供末端抓夹、机器人双臂等局部数据采集遥操作解决方案。另外,与智能驾驶的发展轨迹类似,人形机器人的数据采集也有相应的数据质检、数据标注、数据存储服务商出现——这些共同构成了具身智能真机数据采集的生态链。

为了让机器人有更好的“学习环境”,机器人本体厂商中的“氪金玩家”会自建大型真机训练场。智元机器人就搭建了全球最大的机器人数据生产与采集工厂,100台机器人在这里跟着人类“带教老师”学习如何冲咖啡、熨衣服、扫码结账等等。它们要通过数百条数据,来学会这样一个有一定复杂度的技能。

亚星游戏官网-yaxin222


国家部门和地方政府也在自己搭建机器人训练场。由国家地方共建人形机器人创新中心(位于上海,以下简称“国地中心”)建设的全国首个“异构人形机器人训练场”不久前已投入使用,来自智元、傅利叶、开普勒等十多家企业的100多台机器人在这里一起“上学”,跟着人类老师学习特种、制造、民生服务三大领域里的各种技能。

国地中心首席科学家说明:“异构”是指不同厂家的机器人在形态、功能、技术架构、应用场景上都存在差异。“把不同厂家的异构机器人放在同一空间运行,就能让AI意识到,它活在一个多元多样的物理世界中,从而建立起客观认知,发育出明辨是非的能力。”

国地中心作为国家级创新中心,除了搭建真机训练场,更重要的任务就是统一、规范具身智能机器人的数据标准。2025 年,这个训练场预计将收集 1000 万条高质量机器人实体数据,来支撑机器人基础模型的进化迭代。

仿真训练:无限拓展现实边界

真机数据采集虽然质量最高,但成本也最高,并且难以解决机器人“泛化”问题。许多本体厂商和服务商也在同步探索仿真数据采集和训练解决方案。

比如上文提到智元科技的 AgiBot Digital World,其实是一套开源仿真框架,除了仿真数据集外,还包括专家轨迹生成机制、模型评估工具等,可以实现一系列的具身仿真服务。

亚星游戏官网-yaxin222


在机器人仿真领域,已有许多成熟的仿真平台供机器人厂商进行物品和场景的建模。但随着具身智能近一两年来的火热,国内外服务商也纷纷推出了更灵活、更智能的仿真解决方案。

空间智能企业群核科技,有一个更为人熟知的产品叫“酷家乐”。在为人形机器人提供空间数据之前,群核科技的主要业务是通过酷家乐在家装领域提供设计及渲染服务。设计师和业主都可以在平台上设计自己喜欢的房间装潢,并完成逼真的渲染。

酷家乐在装修领域十几年积累下来的模型数据,现在成了人形机器人最好的训练“养料”。

群核空间智能平台有 3.6 亿个 3D 仿真物品模型,并且具有真实的物理性质,比如密度、摩擦力、弹性、阻尼等等。以前,设计师用这个平台设计人类的家;现在,科学家们同样可以用这个平台设计机器人的工作环境——并且保证物理正确。

亚星游戏官网-yaxin222


“物理正确”是机器人仿真训练中很重要的一点,也是 AI 暂时无法完美解决的难题。OpenAI 发布 Sora 时,人们先是被“文生视频”的强大创造能力所震撼,但紧接着就发现 Sora 缺少对物理规律的理解。在它生成的错乱世界里,牛顿的棺材板砰砰作响。

对于人形机器人来说,真机训练成本过高,而仿真训练需要复杂的建模过程——如果 AI 能无限生成一个“赛博世界”就好了。最好这个数字世界能和真实的物理世界一样运转,人在地上走、鸟在天上飞、水往低处流、球落到地面会弹起、光遇到镜面会反射……

这就是世界模型了。

英伟达在今年 1 月 7 日推出世界模型 Cosmos,可以通过文本、图像或视频提示,生成基于物理世界的、高度仿真的虚拟世界。英伟达对此的定义是:“世界基础模型是一种根据过去发生的事和当前变化来预测未来会怎样的工具。”

亚星游戏官网-yaxin222


理想情况下,有了 Cosmos,自动驾驶汽车可以根据各种天气下的路况做出判断、仓储机器人可以在不同仓库设计取货和搬运路线、人形机器人可以将放满杂物的桌面分门别类收拾干净……而这一切都不需要真机参与,在虚拟世界就可以完成并收获实时反馈。

Sora 在诞生之时也被 OpenAI 定义为“世界模型”,这一领域随着具身智能或者说物理 AI 的发展愈发受到关注。李飞飞创立的 World Labs 正在致力于构建大型世界模型(LWM),GOOGLEDeepMind 也聘请了前 Sora 核心成员投入到世界模型的研发中。

也许就在不远的未来,机器人不用再到一个固定的“工位”上打工,而是可以在无限变换的“赛博世界”里打怪升级、学习技能,再回到物理世界进行实操——听起来,是不是你也挺想试试的。

拥有“具身智能”的人形机器人,就像一个刚出生不久的孩子。为了让它不仅能在过年的时候给亲戚朋友们来一场限定表演,还能不断提升自己的动手能力、学习能力,生长出真正的“智慧”,相关各方都为此“操碎了心”。

从国家到地方、再到各类服务商、以及本体厂商,都在试图攻克数据训练的难关,到达质变的“ImageNet时刻”。未来会怎样?大家将在下一篇文章中聊聊看。


来源:36kr

举报本楼

本帖有 4 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2025-4-22 12:59 , Processed in 0.221623 second(s), 17 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图