JavaScript is required

硬件、模型还没卷完,灵巧手又要“拼数据”了

图片

◎ 告别碎片化数据。

今年5月初,具身智能赛道出现了一个让人印象深刻的demo:Genesis AI 发布了首个机器人基础模型GENE-26.5。

在演示视频里,机器人不仅能做饭、整理线束,甚至还能在实验室里移液、解魔方,更夸张的是它还能弹钢琴。这套动作的流畅度,几乎已经逼近了人类的真实水平。

视频一出,业内都在好奇底层的硬件支撑到底是什么。随后,舞肌科技通过社交媒体表示,GENE-26.5模型演示中使用的核心硬件,正是他们自研的仿生灵巧手 Wuji Hand。

图片

Genesis AI正是基于Wuji Hand的原型,配合1:1的人体比例和反向驱动设计原则,打造了属于自己的独特版本。

这其实也侧面揭示了当前具身智能发展的另一个核心痛点:随着大模型能力的跃升,机器人学习正在从“拼模型”迅速过渡到“拼数据”。

而在物理世界里,最难获取的、也是最稀缺的,就是高质量的“人类示范数据”(Human Demonstration Data)。

要获取这些数据,传统的二指夹爪已经完全不够用了,行业亟需真正能复刻人手能力的硬件载体,以及一套能把这些硬件产生的数据转化为模型“教材”的底层系统。

正是基于这样的产业背景,全球首个具身数据独角兽光轮智能与灵巧手核心硬件提供商舞肌科技近日正式宣布达成战略合作。

双方的合作更像是一次软硬件底层的对齐,以解决目前物理AI数据采集碎片化、标准缺失的行业难题。

01.

第一性原理下,灵巧手的硬件突围

要理解这次合作的价值,得先看看目前我们在硬件上卡在了哪里。

舞肌科技CEO潘韫哲曾指出,如果灵巧手没做好,整个具身智能的操作问题就很难被真正解决,因为这是整个链条里最难、也最关键的一环。

很多公司为了快速出效果,还在使用二指夹爪。这种夹爪不仅抓握稳定性有天然局限,更致命的是,它的数据模态根本无法扩展,遇到复杂场景就得抓瞎。

在舞肌科技看来,只有基于人手形态的灵巧手,才能真正无损、高效地迁移人类的操作数据。

一个真正合格的灵巧手,必须满足五个维度:自由度、尺寸和重量接近人类;极高的可靠性;具备全掌数据;以及拥有类似人类柔软的皮肤。

去年9月发布的Wuji Hand 1.0就是朝着这个方向的一次尝试。

它的掌长为201毫米,和成年人的手掌几乎没有区别。在不到600克的骨架重量下(尺寸为201mm×75mm×50mm),它塞进了20个主动自由度(每指4个),指尖输出力达到15N,静态抓握力高达10kg。

图片

通过采用自锁旋转直驱关节驱动,配合全无刷电机和FOC控制,精度达到了毫厘级别。在可靠性上,它经过了80厘米的跌落测试依然内外无损,使用寿命达到了30万次。

而前不久在ICRA现场,舞肌科技又把这套硬件推向了新的高度,展出了Wuji Hand 2。

这一代产品同样采用了全直驱方案,拥有20个主动自由度,整机重量进一步压减到不足570克,静态握持力却提升到了12公斤。

图片

同时,Wuji Hand 2配备全域触觉感知系统,覆盖24×32点阵的全指柔性触觉阵列,实现了指尖到指腹的全方位触觉覆盖。

配合创新自研的新型电机和轻量化转子设计,Wuji Hand 2的传动效率提升了20%,反向驱动扭矩更是低至0.05N·m。

总的来说,相较于上一代产品,Wuji Hand 2重点在反向驱动能力、结构稳定性、复杂真实场景操作表现三大核心维度完成全方位显著升级,

同时,针对性改善了传统灵巧手实操稳定性弱、场景适配有限等行业共性问题,进一步拉近了高性能仿生灵巧手与规模化产业落地的距离。

但光有手还不够。

潘韫哲认为,触觉在具身智能领域被严重低估了。

触觉传感器的重要性,绝不亚于计算机视觉里的CMOS摄像头。人类真实的触觉不仅是压力,还包括形变、温度、湿度。

要采集这些极其复杂的人类模态数据,就必须从人身上去采,所以触觉传感器最终一定是以“手套”的形式存在。

今年2月,舞肌科技还拿出了Wuji Glove智能数据手套,这是一款专为机器人遥操作和人机交互打造的设备。

它非常轻便,本体净重只有67.5克(含线缆总重192.6克,总长340毫米)。在这轻薄的布料之下,掌心密布着526个有效压力传感器(24×32Matrix),空间分辨率达到了4毫米。它可以实时量化0-20N的压力变化,并以 120FPS 的频率输出数据。

图片

同时,这只手套还是一套精密的动捕系统:5个电磁接收模块在指尖,1个在手背,外加手腕处800Hz高频采样的6轴IMU惯性测量单元。

这套组合拳把位置误差控制在了2毫米以内,姿态精度小于5度。它完美契合了Genesis AI提出的“人手-触觉采集手套-灵巧手”三者 1:1:1 精准映射的理念。

最关键的是,这种方案的成本只有传统硬件的百分之一,而采集效率却是传统方案的五倍。

02.

物理AI,需要10亿个数据生成器

舞肌科技解决了“用什么采数据”的问题,但紧接着行业面临的是另一个更加宏大的难题:“采回来的数据怎么用?”

目前的行业现状是,数据采集极度碎片化。各家团队用的头环、灵巧手、手套都不一样,数据格式千奇百怪,坐标系和校准方式更是鸡同鸭讲。

这就导致了一个尴尬的局面:花大价钱采集的数据,换个团队就没法用,根本没法进行横向比对和跨团队复用。

这就必须提到光轮智能在此次合作中扮演的关键角色。

作为全球前五的世界模型团队都在合作的数据交付冠军,光轮智能看问题的方式有着显著的系统性。

在前不久的智源大会上,光轮智能创始人兼 CEO 谢晨博士抛出了一个非常犀利的观点:在物理AI阶段,如果行业还把数据当成单纯的“燃料”,那最终只能陷入低效的成本内卷。

图片

大语言模型有整个互联网作为免费的预训练语料,自动驾驶有量产车队跑真实闭环,但机器人呢?机器人根本没有一个现成可用的标准预训练集。

物理世界里的交互——抓取、碰撞、摩擦、形变,远比敲键盘输入文字要复杂得多。

因此,物理AI真正需要的不是静态的数据样本,而是一套能够持续产生经验、暴露失败、吸收反馈并生成新材料的“持续教育系统”。

谢晨博士断言,面向未来的规模化落地,物理AI至少需要10亿个能够持续产生数据的数据生成器。

图片

因为真机数据虽然有价值,但受限于成本、环境和本体规模,根本撑不起海量的学习需求。未来绝大多数的数据,必然来自人类行为示范和仿真合成。

为了跑通这套“教育系统”,光轮智能构建了一个极其硬核的Real2Sim2Real(真实-仿真-真实)闭环:

EgoSuite:负责把真实世界里的人类操作经验转化为高质量的示范数据。

RoboFinals:依托其全栈自研的“求解—测量—生成”仿真平台,在工业级仿真环境中进行规模化评测,找出模型的短板和失败模式。

RoboStack:则负责真实场景的部署回流,让机器人在真实世界里碰壁后,把新的反馈带回来。

图片

值得一提的是,光轮智能在推进仿真标准上也有着深厚的布局。

2026年3月,他们作为唯一的中国企业,与NVIDIA、Google DeepMind、Toyota Research Institute等巨头一起,加入了国际开源GPU加速物理引擎 Newton 的技术指导委员会(TSC),直接参与到下一代物理AI仿真标准的规则制定中。

03.

强强联手,

重构数据底座与产业级采集标准

理清了两家公司的底牌,再来看这次光轮智能与舞肌科技的战略合作,逻辑就非常清晰了:这是一场典型的数据系统与顶级感知硬件的双向奔赴。

光轮智能想要重构数据采集底座,打造一个支持10亿人规模的开放人类数据采集平台(HDCP)。

图片

但要让这个平台转起来,必须有最懂灵巧操作和一线触觉数据的硬件厂商来打底。

而舞肌科技虽然在灵巧手本体和触觉建模上有着极强的工程积累(其主力产品 Wuji Hand 1 和 2 已经是多家模型团队的首选),但他们也需要一个统一的数据规范和强大的仿真闭环,让硬件跑出来的数据发挥最大的价值。

双方在产业判断上的高度一致,促成了这次深度协同。具体来看,合作主要在两个维度展开深度绑定:

一是共建开放的人类数据采集标准平台。 

双方准备联手制定下一代人类数据采集标准(Human Data Capture Standard)。

这套标准不是浮在空中的概念,而是要实打实地覆盖灵巧手动作、触觉反馈、力控信号以及多模态时序对齐等最棘手的采集环节。

不仅如此,双方还会围绕这个标准,沉淀出一套包含硬件接入规范、数据格式约定、质量评估方法的基准流程。

目标很明确:把人类数据采集从现在的“手工作坊项目制”,彻底推向可横向比对、可跨团队复用的“产业级生产”。

二是打通Real2Sim与Sim2Real的灵巧操作闭环。

前面提到,灵巧操作涉及复杂的接触、摩擦和力控。

这次合作中,基于光轮智能在Newton物理引擎上的话语权和“求解-测量-生成”三位一体的仿真能力,双方将把舞肌科技的灵巧手和触觉系统进行标准化的仿真适配和物理建模。

简单来说,就是让 Wuji Hand 采集到的真实人类手部操作数据(Real),无缝且精准地投射到光轮智能的仿真环境(SimReady Foundry、RoboFinals 等)中进行规模化的训练和评测(Sim),然后再把在仿真里练就的复杂操作能力,成功部署回真实的机器人灵巧手上(Real)。

这条闭环一旦彻底跑通,将极大地降低行业内灵巧操作的研发门槛。

点击查看全文
评论赞0分享
轨迹
灵巧手舞肌科技

欢迎关注我们!

上海恩翌信息科技有限公司
1NE时代-小恩
188-1775-0862
沪ICP备17041240号-4