JavaScript is required

“世界模型”商业化提速?智在无界让机器人“打工”成本降至150元/月

图片

◎ 机器人“打工”成本降至150元/月

△ 撰文:DONG

具身智能行业里,世界模型的能力虽然惊艳,但一直有个极其现实的痛点:它太吃算力了。

大部分模型只是停留在实验室阶段,摆脱不了数据中心级GPU。

但是,无法在机器人本体的端侧芯片上运行,所谓的规模化落地就是空谈。

不过,这道门槛刚刚被智在无界(BeingBeyond)打破了。他们最新发布的Being-H-Flash模型,完成了全球首个百TOPS级端侧芯片的实时部署。

速度有多快?在百TOPS级端侧平台上,Flash能跑出接近20FPS的实时效果,直接把以往只能跑个位数FPS的同类模型甩在了身后。

这并不是靠硬堆硬件实现的,核心在于技术路线的切换。

图片

像英伟达Cosmos这类传统的“显式”世界模型,预测物理规律靠的是一帧帧生成未来画面,算力全耗在画头发丝、衣服褶皱这些对机器人动作毫无用处的像素细节上了。

而基于此前Being-H0.7打造的Flash版本,走的是“隐式具身世界模型”路线。

它干脆放弃了像素级生成,在感知和动作之间引入可学习的latent query,把对未来的预测直接压缩进“潜空间”。

图片

当然,这条路并不好走。

智在无界在预训练上砸了超20万小时的人类视频和1.5万小时的机器人示教数据,靠庞大的数据完成了模型能力的“第一级跃迁”,才换来了如今端侧实时部署的“第二级跃迁”。

走向现实世界的机器人,必须面对成本、功耗和供应链的约束。

为此,智在无界自研了UAC等推理优化技术,并规划了完整的矩阵:通用基础版aura(推理快2-3倍)、端侧加速版ventus,以及面向产业落地的旗舰版procella。

图片

其中最值得关注的是旗舰版。

它不仅能在2到4周内完成从零开始的新芯片定制适配,更关键的是,它率先打通了“英伟达+国产芯片”的双适配。

这意味着“国产世界模型+国产算力”终于在具身智能领域跑通了工程实践,不再只是一句口号。

机器人的商业化,说到底得算经济账。以“单台机器人日扫码2000件快递”为例,如果用传统的显式世界模型,因为离不开高端GPU,每个月算力成本奔着8000元往上走。

图片

但换上能在端侧运行的Being-H-Flash,成本直接被打到了150元左右,降幅高达98%,甚至比许多主流VLA模型还要低。

图片

从8000元降到150元,意味着那些过去受限于高昂成本的工厂产线、仓储物流甚至家庭服务场景,现在终于用得起世界模型了。

点击查看全文
评论赞0分享
轨迹
人形机器人智在无界

欢迎关注我们!

上海恩翌信息科技有限公司
1NE时代-小恩
188-1775-0862
沪ICP备17041240号-4