◎ 10个月融了10个亿。
△ 撰文:DONG
在具身智能的技术演进历程中,如今正处于一个充满争议与分歧的十字路口。
过去两年里,VLA(视觉-语言-动作)模型几乎统御了机器人“大脑”的主流研发叙事。
然而最近,VLA模型的局限性似乎成为行业共识。此外,摆在纯端到端模型面前的残酷现实:真实物理世界的数据获取成本堪称天价。
机器人若要在复杂环境中不断试错学习,其数据采集效率根本无法与互联网时代大模型的抓取训练相提并论。
这种数据的极度稀缺,直接导致纯端到端模型难以淬炼出应对复杂长程任务的泛化能力。
与此同时,大模型对算力、功耗以及实时性的严苛要求,也成为了横亘在规模化商用面前的巨大阻碍。
当技术路线尚未完全收敛,整个产业界都在焦急地寻找一个更具落地可行性的务实答案。
在这一背景下,一家成立仅仅10个月的“人工智能国家队”企业——星源智机器人,以一种截然不同的解题思路闯入了大众视野。
01.
十亿重金押注
6月3日,星源智正式对外宣布完成新一轮Pre-A融资。
至此,这家成立仅仅10个月的公司,已经累计融资10亿元人民币,成为国内成长速度最为迅猛的具身智能企业。
本轮投资方涵盖了头部财务投资、重量级国资以及产业背景的三大维度资本力量。
在财务投资阵营,松禾资本、创东方、华控基金等知名机构联袂出手。同时,作为老股东的元生创投,更是连续三轮坚定地追加投资。
国资平台的入局同样分量十足。中车资本、北工投资、国君创新投、江西金控等国有资本的联合加持。
产业资本方面,埃泰克、恒兴集团、奇安投资的深度参与,则从侧面验证了星源智的技术在具身智能的规模化应用中具备了不可替代的关键产业价值。
据悉,这笔高达十亿规模的巨量资金,将被星源智重点倾注于三个核心方向:
下一代具身大脑与世界模型的核心技术研发、产品规模化量产落地、顶尖人才引进与团队建设。
在这背后,有一个无法忽视的隐形巨擘——北京智源研究院。
作为国内顶尖的人工智能研发机构之一,北京智源研究院曾成功孵化出了语言大模型上市公司智谱。
而星源智,正是智源研究院在具身智能时代,重点孵化并给予持续重磅支持的核心项目。
伴随着本轮融资的落地,星源智与北京智源研究院也同步宣告了更深层次的绑定,双方将共同出资成立“具身交互世界模型实验室”。
未来,这座实验室将成为双方人才导入、资源共享与技术互补的核心阵地,旨在共同攻坚并开发最前沿的具身交互世界模型技术,以此全面加速顶尖科技成果向产业应用的转化进程。
星源智联合智源研究院、智元机器人实现机器人自主打乒乓球
依托智源研究院源源不断的技术输血,加之世界模型团队的深度融合,星源智目前在通用具身大脑与世界模型这两大具身智能的核心赛道上,均已悄然树立起了行业领跑者的姿态。
02.
星源智的“具身交互世界模型”
要理解星源智的突围逻辑,首先需要剖析其最为核心的“具身交互世界模型”。
在当前的行业语境中,许多团队构建世界模型时,往往重度依赖视频生成思路,试图通过庞大的时序关联数据去“预测”或“生成”未来的画面。
但在星源智的科研团队看来,这种方式偏离了机器人的本质需求。
机器人真正需要解决的核心问题并非「未来世界会呈现出什么画面」,而是「我的动作将如何切实地改变这个物理世界」。
基于这种深刻的底层洞察,星源智走上了一条向物理AI纵深挺进的道路。
他们研发的具身交互世界模型,将核心聚焦于机器人动作与环境变化之间的因果关系。
该模型在潜空间中精妙地捕捉运动物体、交互对象以及关键的状态变化,从而深度学习「当前状态-动作-未来状态」之间复杂而微妙的动态关联。
这种技术理念并非纸上谈兵。
事实上,在世界模型领域,前Meta首席AI科学家、图灵奖得主杨立昆(Yann LeCun)所提出的新型AI架构JEPA,一直被视为一条极具潜力的重要技术路线。
其核心就在于强调在抽象表征空间中学习世界状态的变化,而非死磕像素级的视频预测。
星源智的核心团队在这一方向上展现出了极强的前瞻性,早在2024年,他们就提出了与JEPA极其近似的技术路线,其模型构建时间甚至早于行业内知名的LeWorldModel方案。
如今,这一理念已经逐渐演变为具身智能世界模型的主要范式之一。
通过这一前沿模型,星源智赋予了机器人一种前所未有的「行动前推演」能力,或者可以称之为「内部预演」。
以一个最基础的抓取动作为例,当搭载了该模型的机器人准备拿起桌上的水杯时,它绝不仅仅是停留在识别水杯位置的感知层面。
在机械臂真正探出之前,机器人的大脑内部已经完成了一次高速的模拟演练:它会预判抓取过程中水杯的运动轨迹,分析环境状态可能发生的连带变化,甚至会推演如果动作失败是否存在更优的修正方案,以及后续需要采取的连贯动作。
这一技术跨越的意义是颠覆性的。它意味着机器人正式从被动的看见世界、执行动作,跃升为主动的理解交互、预判后果。
在这个技术框架的支撑下,世界模型蜕变为了连接感知、决策与控制的关键中枢。
星源智正通过这种方式,帮助机器人以更低昂的数据喂养成本、更卓越的推理效率,以及更强大的跨场景泛化能力,从容地踏入复杂、开放且持续变化的真实物理环境。
03.
重塑“具身大小脑”的端侧法则
面对大模型上机部署的重重困境,星源智从2025年8月创立之初,就果断放弃了单纯追逐参数规模的军备竞赛,而是锚定了一条“软硬一体、端侧部署”的差异化突围路径。
星源智在汉诺威展会向英伟达介绍T5在机器人的端侧部署
在其独创的“具身大小脑”协同架构中,系统被赋予了极其明确的分工界限。
“具身大脑”作为高级指挥官,全面接管语言理解、环境感知、任务规划以及长程推理等复杂认知工作,并且尤为难得地具备了反思与重规划能力;
而“具身小脑”则扮演着敏捷执行者的角色,精准覆盖导航、操控等核心的运动控制任务。
这种分层设计与国际具身智能头部企业PI、Figure AI所推崇的“快慢系统”理念不谋而合:由慢系统负责深度的思考与决策,快系统负责毫秒级的实时控制与动作执行。
然而,星源智的野心远不止于此,他们在这一架构的基础上向前迈出了更为决绝的一步:坚持全模型端侧部署。
同时,为了彻底摆脱对云端算力的依赖,星源智不惜投入重金自研端侧算力平台。
这也是,星源智宣称自己不止于大脑,还要做速度最快的端侧具身交互世界模型的底气所在。
04.
商业化上的“双轮驱动”
团队方面,星源智汇聚了来自清华大学、北京大学、中国科学院、慕尼黑工业大学以及北京智源研究院等海内外顶尖高校和研究机构的精英。
他们在世界模型、强化学习以及具身智能等前沿交叉领域拥有多年的深耕经验,这种深厚的科研底蕴使得星源智具备了极强的底层技术原创能力。
更关键的是,这支充满极客色彩的团队并非脱离实际的「学院派」。
星源智创始人兼CEO刘东,曾担任京东智能驾驶总经理,有着极强的大型项目操盘经验。
在京东任职期间,刘东曾全面主导了智能驾驶产品的全栈研发体系构建,并成功跑通了商业化闭环。
商业化落地方面,成立不到一年的时间,星源智的产业触角已经深入到了具身智能的各个关键节点。
星源智打造的软硬一体化解决方案已经深度赋能了行业内的头部机器人本体厂商,目前的客户群体已经覆盖了超过70%的头部具身智能企业。
不仅如此,凭借着在端侧算力和系统适配上的卓越表现,星源智更是成为了英伟达Jetson Thor平台在全球范围内的最大出货商。
在具体的应用场景下沉方面,星源智同样多点开花,与诸多产业资源方展开深度合作。
他们与北京亦庄机器人公司达成了深度的战略协同,将具身智能技术广泛铺设于政务服务、智能巡检、导览导购等日常高频场景中。
更为硬核的是,星源智还与国内多家头部的能源集团、电力集团携手,直接切入到电力巡检、能源设施运维等具有极高价值的复杂工业场景,并成功实现了规模化的落地部署。
正如创始人刘东所期冀的那样,星源智正致力于成为具身大脑和世界模型领域的全球领跑者。
凭借着对“世界模型”这一咽喉技术的突破,以及在端侧部署与规模量产上的执行力,这家成立仅十个月的年轻企业,正一步步兑现着行业的巨大期待。
它不仅有望成为具身智能领域里下一个市值千亿的“智谱”,更将作为关键变量,引领具身智能迈向全新范式。



沪公网安备31010702008139