“世界模型”商业化提速？智在无界让机器人“打工”成本降至150元/月

NE时代智能体更新于: 2026-06-08 09:07:14

◎ 机器人“打工”成本降至150元/月

△ 撰文：DONG

具身智能行业里，世界模型的能力虽然惊艳，但一直有个极其现实的痛点：它太吃算力了。

大部分模型只是停留在实验室阶段，摆脱不了数据中心级GPU。

但是，无法在机器人本体的端侧芯片上运行，所谓的规模化落地就是空谈。

不过，这道门槛刚刚被智在无界（BeingBeyond）打破了。他们最新发布的Being-H-Flash模型，完成了全球首个百TOPS级端侧芯片的实时部署。

速度有多快？在百TOPS级端侧平台上，Flash能跑出接近20FPS的实时效果，直接把以往只能跑个位数FPS的同类模型甩在了身后。

这并不是靠硬堆硬件实现的，核心在于技术路线的切换。

像英伟达Cosmos这类传统的“显式”世界模型，预测物理规律靠的是一帧帧生成未来画面，算力全耗在画头发丝、衣服褶皱这些对机器人动作毫无用处的像素细节上了。

而基于此前Being-H0.7打造的Flash版本，走的是“隐式具身世界模型”路线。

它干脆放弃了像素级生成，在感知和动作之间引入可学习的latent query，把对未来的预测直接压缩进“潜空间”。

当然，这条路并不好走。

智在无界在预训练上砸了超20万小时的人类视频和1.5万小时的机器人示教数据，靠庞大的数据完成了模型能力的“第一级跃迁”，才换来了如今端侧实时部署的“第二级跃迁”。

走向现实世界的机器人，必须面对成本、功耗和供应链的约束。

为此，智在无界自研了UAC等推理优化技术，并规划了完整的矩阵：通用基础版aura（推理快2-3倍）、端侧加速版ventus，以及面向产业落地的旗舰版procella。

其中最值得关注的是旗舰版。

它不仅能在2到4周内完成从零开始的新芯片定制适配，更关键的是，它率先打通了“英伟达+国产芯片”的双适配。

这意味着“国产世界模型+国产算力”终于在具身智能领域跑通了工程实践，不再只是一句口号。

机器人的商业化，说到底得算经济账。以“单台机器人日扫码2000件快递”为例，如果用传统的显式世界模型，因为离不开高端GPU，每个月算力成本奔着8000元往上走。

但换上能在端侧运行的Being-H-Flash，成本直接被打到了150元左右，降幅高达98%，甚至比许多主流VLA模型还要低。

从8000元降到150元，意味着那些过去受限于高昂成本的工厂产线、仓储物流甚至家庭服务场景，现在终于用得起世界模型了。

点击查看全文

评论赞0分享

版权所有：	上海恩翌信息科技有限公司
联系人1：	NE时代-小恩
联系电话：	188-1775-0862
备案许可号：	沪ICP备17041240号-4

NE时代