◎ 机器人“打工”成本降至150元/月
△ 撰文:DONG
具身智能行业里,世界模型的能力虽然惊艳,但一直有个极其现实的痛点:它太吃算力了。
大部分模型只是停留在实验室阶段,摆脱不了数据中心级GPU。
但是,无法在机器人本体的端侧芯片上运行,所谓的规模化落地就是空谈。
不过,这道门槛刚刚被智在无界(BeingBeyond)打破了。他们最新发布的Being-H-Flash模型,完成了全球首个百TOPS级端侧芯片的实时部署。
速度有多快?在百TOPS级端侧平台上,Flash能跑出接近20FPS的实时效果,直接把以往只能跑个位数FPS的同类模型甩在了身后。
这并不是靠硬堆硬件实现的,核心在于技术路线的切换。
像英伟达Cosmos这类传统的“显式”世界模型,预测物理规律靠的是一帧帧生成未来画面,算力全耗在画头发丝、衣服褶皱这些对机器人动作毫无用处的像素细节上了。
而基于此前Being-H0.7打造的Flash版本,走的是“隐式具身世界模型”路线。
它干脆放弃了像素级生成,在感知和动作之间引入可学习的latent query,把对未来的预测直接压缩进“潜空间”。
当然,这条路并不好走。
智在无界在预训练上砸了超20万小时的人类视频和1.5万小时的机器人示教数据,靠庞大的数据完成了模型能力的“第一级跃迁”,才换来了如今端侧实时部署的“第二级跃迁”。
走向现实世界的机器人,必须面对成本、功耗和供应链的约束。
为此,智在无界自研了UAC等推理优化技术,并规划了完整的矩阵:通用基础版aura(推理快2-3倍)、端侧加速版ventus,以及面向产业落地的旗舰版procella。
其中最值得关注的是旗舰版。
它不仅能在2到4周内完成从零开始的新芯片定制适配,更关键的是,它率先打通了“英伟达+国产芯片”的双适配。
这意味着“国产世界模型+国产算力”终于在具身智能领域跑通了工程实践,不再只是一句口号。
机器人的商业化,说到底得算经济账。以“单台机器人日扫码2000件快递”为例,如果用传统的显式世界模型,因为离不开高端GPU,每个月算力成本奔着8000元往上走。
但换上能在端侧运行的Being-H-Flash,成本直接被打到了150元左右,降幅高达98%,甚至比许多主流VLA模型还要低。
从8000元降到150元,意味着那些过去受限于高昂成本的工厂产线、仓储物流甚至家庭服务场景,现在终于用得起世界模型了。



沪公网安备31010702008139