JavaScript is required

人形机器人的“双足困局”:形态之争背后,最优解该如何定义?

对人类而言困难的高等推理(比如下棋)对AI相对容易,而人类无意识的感知和运动技能(比如抓取一个玻璃杯)对机器人却极端困难。这一现象被称为“莫拉维克悖论”。

从春晚舞台上的秧歌舞表演,到人机协作跑马拉松;从绿茵场上的灵活踢球,到工厂里的精准操作。人形机器人早已跳出实验室的玻璃罩,在多元场景中展现出与人类互动协作的强大潜力。

它们不再是科幻电影里的未来符号,而是一步步走进现实,悄悄改写着机器与人的共处边界。

但一个疑问也随之浮现:机器人一定要是人形吗?明明不少功能型机器人(比如扫地机器人、机械臂)无需类人形态,也能高效完成任务。尤其当场景转向家庭这个充满生活化细节、更需要适配人类习惯的空间时,执着于 “人形” 设计,究竟是必要选择,还是单纯的技术炫技?

不少公司用产品给出了答案,比如1X 公司近日发布的家用人形机器人 NEO,这款以“进家干活”为核心目标的产品,不仅明确了 20,000 美元(约 14.2 万元)的售价与 2026 年的交付计划,更用设计逻辑回应了为何人形的问题。

NEO身高 167cm、体重 30 公斤,恰好适配人类家庭的家具高度(比如抬手够到橱柜、弯腰清理马桶),22 个自由度的肢体设计,能模仿人类的抓、提、挂动作,轻松处理衣物收纳、重物搬运等家务,就连外表的针织衣物与软体机身,也是为了让类人形态更具亲近感,避免给老人、孩子带来压迫感。

再比如星尘智能给了另一个答案。星尘智能在2024年8月正式发布的首款完整形态产品Astribot S1,是国内首款进入养老院的轮式人形机器人,具备高价值的上半身,可落地的下半身,关键零部件自研,具备明显的成本优势,便于商业化落地。Astribot S1可执行熨叠衣物、分拣物品、颠锅炒菜、吸尘清洁、竞技叠杯等多项复杂任务,还能够给老人递矿泉水、分发茶点,陪伴老人打太极、跳广场舞等。

一个机器人产品的落地,藏着机器人产品形态的核心逻辑。那么,人形是“可选项”还是“必选项”?轮与足的形态之争又是何解?

01.

“人形” 是机器人的最优形态吗?

宇树科技此前发布的Unitree H2 仿生人形机器人,其以180cm 身高、70kg 体重更加贴近人类身材,采用拟人度更高的仿生脸部设计(眼睛含感知功能),可流畅完成芭蕾、武术等高柔韧度运动及时装走秀。同时,宇树已构建H、G、R系列的人形机器人产品矩阵。

不难看出,宇树科技的人形机器人更强调运动能力的极致表现,比如跳舞、打拳击等。那么,“人形” 是机器人的最优形态吗?

援引安克创新CEO Steven 阳萌在@老石谈芯的交流中提及的观点,如果从第一性原理推导,人形在操作、效率、场景适配性等方面均优于其他形态,是机器人实现高效功能的最优解。

“如果你回到本质去看的话,当你需要两个手操作,然后它能移动的时候,其实人形真的就是那个最理想的形态。”Steven 阳萌如是说。

显然,人形机器人最显著的优势之一是其对人类环境的高度适应性。特别是在需要与人类密切互动、使用人类工具、适应人类环境的场景中,人形机器人展现出了不可替代的价值。

现实世界中,绝大多数设施是依据人类的身体结构与运动模式设计的,从门把手、楼梯到桌椅、工具,无一不是为人类量身定制。人形机器人天然匹配这些既有环境,无需对基础设施进行大规模改造即可无缝接入。这种环境兼容性使人形机器人能够直接适配为人类设计的工具和环境,大大降低了应用成本和难度。

英伟达和特斯拉也都是「人形」的拥护者。

黄仁勋曾直言“人形是通用机器人成功的唯一形态”,原因在于技术需要规模效应,而人形机器人很可能成为下一个数万亿美元级的产业,而且技术创新速度非常快。

马斯克同样看好通用人形机器人。马斯克要求Optimus做出来必须是一款人形,并且体态和人一样的机器人,而不是波士顿动力公司或其他公司造的四条腿或者带轮子的机械装置。

为了模拟人手的能力,马斯克表示,特斯拉工程师甚至去请教外科医生,研究人手的肌肉和发力机制。“要造出一只像人手一样灵巧和干练的手,是一件非常困难的事情。”马斯克如是说。

然而,人形机器人并非在所有场景中都是最优选择。在工业生产、危险环境作业等特定场景中,传统工业机器人或其他形态的机器人可能更具优势。相较而言,人形机器人的拟人化确实能够拓宽机器人的应用领域,但难以在单一任务上实现高效率和高稳定性。

就比如特斯拉机器人团队前负责人克里斯·瓦尔蒂(Chris Walti)曾公开质疑Optimus 实际应用能力。瓦尔蒂指出,在仓库、物流和制造领域,需要高度重复和高速执行任务,而人形机器人因结构限制难以胜任。他认为,当前技术水平尚无法实现有效部署,且人形结构演化目的与工业需求不匹配。

此外,人形机器人的研发和维护成本较高,这在一定程度上限制了其大规模应用。从技术性价比角度考量,同样的资源若投入于专用机器人(如扫地机器人、物流 AMR 或协作机械臂),往往能带来更明确的效率回报与稳定性优势。

马斯克在三季度电话会上确认,第三代人形机器人 Optimus 的设计定型将推迟到明年一季度。根据相关供应商表示,Optimus 面临的工程难题不只是手,一切还在快速变化中。目前,Optimus 的性能跟替代人的目标还有相当距离,寿命、效率还无法胜任工厂工作。

因此,在选择机器人形态时,需要综合考虑任务需求、环境复杂度、成本与可靠性、技术成熟度和用户接受度等因素。

02.

“轮”与“足”的形态之争

当双足机器人的支持者强调「世界为人设计,通用机器人必须是人形」时,实用主义者开始试图证明上半身的灵巧操作能力或许更能撬动商业落地。如果也从第一性原理推导来看,能满足任务需求的才是最优解,无需执着于双足形态。

从下肢形态角度来看,人形机器人还可以细分为足式、轮式甚至轮足混合式

足式的仿生双足设计,依赖多关节伺服电机和减速器精确驱动以实现类人步态的前进与转向,且对步态规划和动态稳定性有复杂要求。

区别于足式,轮式包含单轮、双轮、三/四轮移动等多种形态,其下肢核心在于转向机构和轮系设计。而在平衡控制方面,多轮设计可保证平台稳定性,大多通过控制电机来驱动轮子的转动完成移动和转向。即便是几何平衡较差的双轮设计也可通过陀螺仪和加速度计实时监测姿态、调整电机输出保持平衡。

基于此,轮式形态具备训练难度小、成本低、长续航等优势,更适配落地场景的应用需求,相比于双足机器人更容易实现商业化落地。换句话说,目前灵巧手和“感知–规划–执行系统”的升级更为关键,而对于商业化进度领先的主要下游应用场景而言,下肢仅需拥有稳定性和速度来完成移动即可,轮式形态则更适配落地需求。

双足机器人多来自“硬件派”,通过自身硬件和运动控制上的核心竞争力,强化本体以实现在复杂地形和空间的通用性;轮式机器人多来自“软件派”,通过聚焦人工智能和具身大模型的开发,优势在稳定性、低能耗、低成本。

比如宇树科技强调硬件自研,核心零部件自研比例超90%,包含电机、减速器、激光雷达等,同时开发了仿生 4D 激光雷达、足端力传感器等关键部件。在运动控制算法上,宇树科技通过强化学习+多模态交互,适配复杂地形。

银河通用则专注于具身多模态大模型通用机器人研发,自创立起便坚持合成数据驱动具身智能训练的技术路线,也就所谓的“仿真派”,其 CEO 指出,人形机器人存量未达自动驾驶领域百万级设备规模时,依赖海量真实数据训练成本高、周期长,会制约大模型训练效率与场景适应能力。

银河通用于 2024 年 6 月发布首代具身大模型机器人 Galbot G1,采用了“双臂+折叠本体+轮式底盘”的躯体结构,而非双足形态,更加侧重于上肢的操作能力。此后又推出面向抓取、零售、导航的端到端大模型 GraspVLA、GroceryVLA 及 TrackVLA。

目前,银河通用的轮式人形机器人在零售、药房场景率先落地应用,并零售药房领域实现市场化运营。同时落地应用在包括在奔驰、极氪的工厂负责搬运箱体、分拣物品、装载;在公共服务和接待场景里迎宾、讲解、参观引导等。

再比如,千寻智能今年6月推出国内首个高精度全身力控具身智能商用级轮式人形机器人 Moz1。该机器人拥有 26 个自由度(不含灵巧手),搭载全球功率密度最高的一体化力控关节与国内首款高精度高速 WBC 全身运动控制系统,可实现全身零延迟远程操控与流畅协调动作,还搭载自研具身智能大模型 Spirit v1,支持多线程运动规划、视觉闭环,能完成桌面整理等工作并突破柔性物体长程操作难题。

而千寻智能于2025 年 5 月推出的OneTwoVLA 大模型,更使其跨任务自学习能力与迭代速度远超行业平均。目前 Moz1 已深度参与办公室场景,自主完成会议室清洁等任务,开启商业化进程,后续计划将技术复制至购物中心、零售门店等更多商用场景。

智元机器人则是足式和轮式的多形态产品综合布局。以机器人本体为基,融合交互/作业/运动智能,智元机器人拥有远征、精灵、灵犀三大产品线,技术产品布局全面且出货量居行业第一梯队。

其中,轮式机器人应用明确,搬运任务上远征 A2-W 单箱搬运约 40 秒、成功率 99.9%,曾 4 台在富临精工工厂高温环境下三小时无误搬运 800 多个周转箱;分拣任务上精灵 G1 曾在 2025 年 WAIC 大会联合德马科技完成全球首例端到端具身智能机器人物流作业直播,能灵活分拣衣物包裹、精准放置并调整条码朝向配合扫描。

今年10月,智元精灵 G2 首次线下公开亮相,凭借自主研发的高性能关节执行器、多传感器阵列及 AI 计算平台实现毫米级智能力控,适配汽车制造“高精度、高柔性、高稳定性” 需求。据规划,首批交付的智元精灵 G2 将率先部署于均胜电子的汽车零部件产线。

今年3月发布通用具身基座模型 GO-1,通过ViLLA架构实现小样本快速泛化,技术门槛显著降低,并在今年9月全面开源。

“我们不只是做几款机器人,而是打造一套可自我进化的通用具身智能体底座。”智元机器人联合创始人兼 CTO 彭志辉现场介绍道。

可以预见的是,目前轮式人形机器人主要在零售药房等商业服务场景、搬运和物流分拣等工厂场景进行试点落地,有望以零售和工厂等B端市场作为切入点,逐渐实现商业化落地,验证商业价值并提高渗透率。

然而,双足机器人也可解决轮式无法克服的痛点,在不平坦的地形上更具灵活性和适应性,比如户外复杂地形、跨障碍物、爬楼梯,通用性更强,更符合人类世界适配的终极需求。

因此,也有观点认为,双足机器人是高度通用的终极硬件形态,开发双足可提升技术边界。同时,随着双足机器人的稳定性提升+规模效应形成(潜在应用规模大),未来成本差距将缩小,经济性逐步改善。

但轮式同样不会被替代,其在相对静态场景的精细化操作,比如工厂固定工位等;平坦地形的高速移动,比如如物流仓库等,具备不可替代的效率优势,且成本更低、技术成熟度更高,可与双足形成场景互补,而非替代关系

03.

写在最后

随着技术的不断进步和应用场景的不断拓展,人形机器人将与其他技术和形态的机器人相互融合,形成更加多样化、智能化的机器人生态系统。

未来的机器人可能不再严格区分人形与非人形,而是根据具体需求选择最适合的形态和功能组合。换句话说,人形不是目的,核心评判标准都是适配性与实用性,形态只是实现目标的手段。

就如王兴兴曾明确表示,宇树并非坚持人形不可,选择人形路线,一方面是因为机器狗的技术可复用,另一方面是人形机器人更利于数据采集。

总之,人形机器人的最优性是有条件的,取决于具体的应用场景、任务需求和技术水平。在与人类密切互动、使用人类工具、适应人类环境的场景中,人形机器人展现出了独特的优势,有望成为机器人发展的重要方向之一。

未来,随着 AGI(通用人工智能)的实现,机器人形态必将走向多样化。

点击查看全文
评论赞0分享
轨迹
人形机器人形态

欢迎关注我们!

上海恩翌信息科技有限公司
1NE时代-小恩
188-1775-0862
沪ICP备17041240号-4