◎ 姚卯青谈具身智能的部署、数据与下一轮竞争。
△ 交流来源:小宇宙@卫诗婕|漫谈Light the Star
具身智能行业频繁用 Demo 展示技术效果。
但对一家准备进入真实市场的公司来说,完成一次动作只是起点。客户是否愿意使用和付费,机器人能否稳定工作,企业能否把方案复制到更多场景,才是商业化需要回答的问题。
姚卯青给出了一套阶段划分:“24年叫做量产元年,25年我们叫做商用元年,26年我们叫部署元年。”
姚卯青是智元机器人合伙人、具身业务部总裁,同时担任觅蜂科技董事长兼 CEO。
在交流中,他把讨论集中在几项具体问题上:机器人如何进入客户现场,现阶段为什么更应关注后训练,什么数据能进入模型训练,以及数据平台如何连接供需。
这些问题构成本文的主线:具身智能企业既要交付可用产品,也要持续获得能够支持模型迭代的数据。
交流来源:卫诗婕|漫谈Light the Star《77.有关智元、觅蜂的愿景与野心,和具身智能的竞速之旅|与姚卯青的对谈》(如有侵权,请联系删除)
01.
Demo之后,客户开始用部署和付费检验产品
对于怎样判断一项机器人技术是否成熟,姚卯青给出的标准很直接:“如果这个技术,这个产品真的已经牛到不行了,真的效果非常好的,那一定是有人愿意去使用的,一定是有人甚至愿意去买单的。”
按照这套判断,一个 Demo 可以记录机器人在特定条件下完成某项任务,却不能单独证明它能长期运行,也不能证明客户愿意承担采购、部署和维护成本。本文因此把 Demo 与市场验证分开讨论。
他提到,如果一项技术尚未进入实际应用,无论原因是产品还未达到客户标准,还是展示效果无法复制,“归根结底都是还没法走入市场”。
姚卯青用三个“元年”描述智元所处的节奏。即“24年叫做量产元年,25年叫做商用元年,26年叫部署元年。”
当卫诗婕问及机器人怎样打开应用场景时,姚卯青把“聚焦”放在首位。他说,一家成立时间不长的公司不可能同时覆盖所有行业,只能在有限资源下逐个突破。
“瞄准最和当前技术匹配,瞄准最愿意和你共创的客户,以及瞄准最有规模化部署和复制潜力的这样一些场景,去把它打穿打透。”他说。
这三个条件分别对应技术可行性、客户共创意愿和规模复制潜力。姚卯青据此解释智元筛选早期场景的方式。
在 B 端场景中,姚卯青把定价逻辑落到 ROI。他认为,只要机器人在全生命周期内能够覆盖等效人员成本,企业就能据此形成相应的售价。该说法是他对客户采购逻辑的概括,具体测算仍取决于场景和项目条件。
按照姚卯青的思路,商业化早期应先在少数场景中验证成功率、成本和复制流程,而不是同时覆盖更多行业。
02.
基模叙事之外,后训练与数据工程决定当下效果
姚卯青对行业热衷的“基模”叙事持保留态度。他认为,现阶段具身智能的数据量级距离真正支撑基础模型仍有较大差距,很多 Demo 的表现来自围绕具体任务进行的后训练。
“机器人很重要的一点就是后训练。甚至在今天来讲,我觉得后训练是更重要的。”他说,“大部分的 Demo 都是通过后训练出来的。”
同时姚卯青强调,任务 Demo 的效果与基础模型能力不能直接画上等号。
姚卯青进一步表示,当前数据数量级与他所理解的真正基模“可能还差了四五个数量级”。
这就意味着在可用数据仍有限的阶段,企业需要通过后训练和任务数据验证具体效果。
姚卯青把数据质量拆成两部分。
第一部分是采集链路的工程质量,包括时间同步、传感器与执行器标定、轨迹重建精度,以及软硬件参数的一致性。
第二部分是数据分布,样本需要覆盖不同任务、场景、位置、光照和背景,而不能反复记录高度重复的动作。
“你不能去反复地采集完全重复的这些片段。你至少要在位置、光照或者背景这些方面每一次都要做出一些调整。”他说。
姚卯青认为,只记录成功示范会产生局限。机器人一旦偏离见过的数据,可能不知道如何继续执行,因此训练数据还需要覆盖失败后的重新规划和恢复。
姚卯青强调:“失败之后再重新规划再成功,其实这个数据是非常重要的。”他把这类样本也称作“脏数据”,但随即澄清,这里的“脏”指失败和偏离,而不是摄像头黑屏、轨迹误差过大等采集质量问题。
姚卯青认为,数据需求还会随模型能力变化。训练早期,团队可以围绕预设任务采集数据;当模型具备一定能力后,研发人员会要求采集模型仍然失败的场景。数据团队需要与算法团队持续对齐,调整任务设计和样本分布。
这也解释了为什么数据竞争不能只比较数量。数据是否稳定、是否覆盖关键分布、能否跟随模型问题快速更新,都会影响它能否转化为训练效果。
03.
仿真还是真机,任务指标比技术流派更重要
谈到仿真和真机数据时,姚卯青没有选择单一答案。他认为,团队需要把数据来源放到具体任务、环境和操作对象中讨论。
“有一些任务,有些操作交互的对象来讲的话,仿真确实也可以完成很多的这种前期的开发和验证。”他说。仿真环境还可以调整场景元素,为模型提供更多变化。
但他同时指出,一些任务包含精细的物理交互,只有真实接触才能获得更贴近实际的数据分布。对于这类任务,真机数据仍然必要。
这意味着,仿真与真机的比例不能脱离任务确定。环境能否高保真重建、接触过程是否复杂、客户要求怎样的成功率,都会影响数据方案。交流没有给出统一比例,也没有把某条路线定义为所有任务的最优解。
姚卯青把路线选择的最终约束放在应用效果上。他举例说,百分之八九十的成功率在学术验证中可能看起来不错,但工厂客户可能要求“四个九”。
“我只能想尽一切办法让它达到这个标准,而不是去执着于我是什么技术流派。”他说。
这句话把讨论从路线名称转向交付指标。企业需要回答机器人在多少次任务中能够成功,失败后如何恢复,现场是否允许人工接管,以及方案成本能否被客户接受。仿真和真机都是达成目标的手段。
04.
数据平台的生意:连接供需,也组织分散产能
在姚卯青的设想中,觅蜂不只提供一次性数据采集服务。它希望连接数据需求方与生产方,将定制采集、第三方产能和货架数据放入同一个平台体系。
他把觅蜂的角色概括为“链接供需两边的一个需求,然后作为一个平台的性质去提供价值链接”。对于合作紧密的运营方,平台按照统一设备和标准组织生产;对于合作相对松散的第三方,觅蜂也计划允许其将数据放入数据商城。
按照这一构想,平台同时面对定制采集和已有数据交易。交流较详细地解释了定制采集中的需求沟通、场景设计和质量控制,但没有展开货架数据的产品字段与交易流程。
数据商城仍属于交流中描述的产品方向。现有材料没有给出其交易规模、客户数量或成熟度,因此不能把它写成已经形成规模流通的市场。
姚卯青认为,物理 AI 的数据竞争比的是获取速度,而不只是所有权。“更重要的是我能够以最短的时间获取到海量的数据。”他转述客户需求时用了一个英文表达:“as many as possible, as soon as possible。”
对未来供需关系,姚卯青判断,数据需求的增长可能快于供给扩张。“供给的量的上升、规模的上升,应该是赶不上需求量的一个上升的。”这是一项前瞻判断,交流没有提供可验证的行业统计。
姚卯青对平台标准化的判断分为两个阶段:当前服务仍需要适应客户差异,长期则可能围绕采集参数、模态和质量形成共识。
姚卯青承认,“现在也不能完全去统一每一个数据使用方的需求”,当前服务仍带有差异化和定制属性。但他预计,围绕视场角、帧率、分辨率、相机布局和其他模态的要求会逐步收敛,并称行业可能在未来一年左右形成一些基本共识。
他还预计,机器人进入大规模商用后,安全和准入标准会形成更清晰的门槛,时间上可能在两到三年内发生。
姚卯青还把开放数据和开发平台放进同一条商业闭环。他希望更多开发者使用机器人进入有价值的场景;在用户授权的情况下,应用数据可以回流,用于增强底层模型能力。
他将其称为“从商业成功再到数据飞轮的一个完整的故事”。
05.
从 G3 到 G4,“涌现”仍需要数据和实验验证
对具身智能当前能力所处的位置,姚卯青使用了一套 G1 至 G5 的分级框架。他认为,行业大致处于 G3 到 G4 的过渡阶段。
按他的解释,G3 指机器人能在特定场景、特定任务下端到端自主执行;G4 则要求机器人跨场景、跨任务完成端到端执行。“我觉得我们现在应该是在3到4中间的一个过程。”他说。
对于跨越这段距离需要多少数据,姚卯青把一亿小时视为一个应当先验证的门槛。他同时明确表示:“一亿再往上的话,我觉得大家现在都无法做出准确的预测。”
姚卯青期待看到的画面,是机器人出现一个“aha moment”:它能够在复杂环境中进行自主规划,响应指令,而不是只完成从画面到动作的映射。
06.
下一轮竞争要同时回答两个问题
从 Demo 到部署,具身智能企业需要回答机器人今天能不能工作。围绕后训练、数据采集和平台运营,企业还要回答机器人明天怎样变得更好。
姚卯青把客户付费、场景 ROI、失败数据、供需连接和行业标准放在同一套产业判断里。他认为,真实应用会产生数据,数据回流会推动模型迭代,模型能力再支撑更多应用。
这条路径仍有多个环节需要验证。客户是否持续采购,机器人能否达到现场成功率,数据平台能否将定制服务转化为规模效率,数据增长能否带来跨任务能力,都会影响行业下一阶段的速度。
对于最终的“涌现时刻”,姚卯青说自己“非常期待”。他也承认,更高数据规模之后会发生什么,目前无法准确预测。
*交流来源:卫诗婕|漫谈Light the Star《77.有关智元、觅蜂的愿景与野心,和具身智能的竞速之旅|与姚卯青的对谈》(如有侵权,请联系删除)



沪公网安备31010702008139