◎ 混合驱动如何击碎“不可能三角”?
长久以来,灵巧手的研发被困在一场非黑即白的路线之争中:
是以追求极致物理真值和零延迟的直驱路线为主,还是走向追求仿生与轻量化的腱绳路线?
“自动驾驶与灵巧操作之间有太多相似之处。”曦诺未来创始人兼CEO夏宇轩在演讲中给出了一个形象的类比。
在他看来,灵巧手的纯腱绳路线和自动驾驶的纯视觉路线理念趋同:立足第一性原理、追求高度仿生,依托轻量化极简硬件打造系统,却均存在物理失真问题。
但是,纯视觉难以获取真实三维深度,腱绳驱动则受传动特性与非线性因素制约。
灵巧手的纯直驱路线则类似自动驾驶的重型激光雷达方案,优势在于精确的物理真值、完美的关节扭矩和零延迟,弊端集中在设备笨重、发热偏高、整体成本昂贵。
“当纯粹的单一路线触及物理极限时,融合就成了可扩展的架构。”夏宇轩表示。
就像自动驾驶最终迎来了BEV Fusion(鸟瞰图空间融合)一样,相机和激光雷达的数据实现了无缝融合。
类比到灵巧手行业,混合驱动会不会才是商业上可行的终极方案?
近期,包括曦诺未来、伯牙智能以及临界点在内的多家国内头部灵巧手初创企业,都不约而同地交出了基于混合驱动路线的现象级产品。
这个方案、这些产品,是否能够打通纯腱绳、纯直驱两大技术路线的壁垒呢?
01.
人手的“第一性原理”
“技术路线本身不是最重要的,真正重要的是你想解决什么问题,并为此做怎样的取舍。”伯牙智能创始人兼CEO刘欣道破了当下灵巧手破局的核心逻辑。
“生物学永远是最好的老师。”夏宇轩表示,当我们重新审视人类自身的双手时,会发现大自然在漫长的进化中,早已给出了一个答案。
人类的手和前臂依赖两种截然不同的肌肉系统协同工作:
位于手掌内的“内在肌”体积微小(约30-60立方厘米),直接作用于关节,实现高弯曲和零迟滞的位置操控;
而位于前臂的“外在肌”体积则大得多(约250-400立方厘米),它们通过长长的肌腱跨越手腕,将巨大的力量传递到指尖,实现强力的抓握。
这种巧妙的分工,正是人手能够兼具穿针引线的精细与提拉重物的强悍的原因。
基于这一生物学共识,各家厂商在架构设计上殊途同归:
曦诺未来在推出其最新一代23自由度(19主动+4被动)的Flex 2灵巧手时,彻底抛弃了二元对立的思维。
他们将十几个微型线性驱动器后置(类似外在肌),通过腱绳传递提供大范围的关节屈曲和强劲握力;
同时,在手掌内部直接放置了几个微型直驱电机(充当内在肌),专门负责MCP(掌指)关节的侧摆和对指等需要严格线性控制和极高响应速度的动作。
曦诺未来|Flex 2
这种平衡,让Flex 2在ICRA展会现场连续运行一整天也未因过热而宕机,因为最大的发热源已经远离了真正的操作末端。
伯牙智能最新发布的高山S1同样采用了基于人手生理结构的混合驱动路线。
伯牙智能把灵巧手重新拆开,把手掌、小臂和手腕三个看似“孤立”的部件组成一套协同系统。
“人的手之所以能同时做到轻末端和大力量,并不是因为所有肌肉都长在手掌里。主要力量来自小臂肌肉,再通过肌腱传递到手指;手掌内部的小肌肉,则更多负责精细调整。”刘欣表示,伯牙智能的混合驱动路线,也是沿着这个思路展开的。
伯牙智能|高山S1灵巧手
在不到500克(近似人手)的重量下,高山S1保留了用于精细调整的手部微型驱动单元,而将主要抓握力量交由小臂端驱动。
通过这种解耦式的设计,高山S1不仅拥有22个自由度,其指尖力更是达到了惊人的30N。
正如刘欣所比喻的:“如果客户需要单根手指承重5kg,我们只要把小臂电机加大就行,就像一个人去健身房撸铁半年,胳膊粗了,力气自然就大了,而不需要重构整个手掌结构。”
临界点则在其旗舰产品OmniHand 3 Ultra-T上,打出了“绳驱主导、混合直驱”的王牌。
他们深知,灵巧手不再仅仅是一个孤立的末端执行器,而是连接感知、决策与控制的系统核心组件。
临界点|OmniHand 3 Ultra-T
通过引入关键部位的直驱能力,OmniHand 3 Ultra-T在保留绳驱轻量化(自重不到500g)的基础上,大幅度提升了侧摆力与控制精度,并在满分通过卡潘吉(Kapandji)对指测试的同时,做到了0.3秒的极速开合。
大家终于意识到,与其在电机的蛮力与腱绳的优雅之间痛苦抉择,不如做一个聪明的“拿来主义者”,实现系统级的融合。
02.
击碎“不可能三角”
长期以来,灵巧手被认为存在一个“重量轻、精度高、力量大”的不可能三角。
但随着混驱方案的落地,加上精密制造工艺的突破,这个不可能三角正在被击碎。
在轻量化方面,特斯拉Optimus的技术演进以及全球顶尖模型厂商的反馈都在印证一个事实:“臂手一体、轻量化末端”是通用机器人的必经之路。
因为如果手部过重,会极大地增加机械臂的惯量负担,导致动作迟缓且危险。
目前,曦诺未来的Flex 2将整手重量压榨到了400g以内,临界点的OmniHand 3 Ultra-T和伯牙智能的高山S1也都控制在了500g以内,这几乎完美复刻了成年人手掌的重量。
但这并不意味着力量与精度的妥协。
以曦诺未来Flex 2为例,这款产品不仅拥有超过20N的指尖力,还能实现抓握提拉负载20kg、平举10kg的强悍输出。
得益于直驱单元与自研微型电缸的配合,其重复定位精度达到了≤±0.1mm,力控精度达0.05N。
在展会现场的极限演示中,它既能柔顺地盛起爆米花而不将其捏碎(腱绳缓冲发挥作用),又能稳稳地握住画笔勾勒简笔画而线条毫不抖动(直驱精确定位发力)。
曦诺未来|Flex 2
它被定义为“灵、巧、智、劲、美、稳”六个维度全能的“六边形战士”。
临界点OmniHand 3 Ultra-T则在材料与结构上下了血本。
为了实现同自由度(22+3)下全球最轻,其骨架大胆采用了镁合金替代传统铝合金,并在应力集中点辅以钛合金强化。
临界点|OmniHand 3 Ultra-T
配合自研的行星滚柱丝杠微型电缸,这只手能爆发出300N的额定输出力,负载自重比高达惊人的10:1。
腕部设计更是打破常规,实现了前后55°、左右40°的超大运动弧度,远超行业不足30°的平均水平。
那么,如何解决腱绳寿命的问题?
纯绳驱路线最让人诟病的就是腱绳的蠕变、磨损与松动。
不久前,马斯克甚至亲自承认,特斯拉第三代灵巧手专利中采用的“复合柔性韧带”三明治结构(试图通过增强层防止错位)在实际测试中根本行不通。
面对这个世界级难题,中国灵巧手厂商给出了极具实操性的工程解法。
伯牙智能的逻辑是:不要试图消灭磨损,而是要去管理它。他们通过自研柔性力控绳驱模组,攻克行业长期存在的腱绳蠕变难题。
通过材料、结构和保护设计,伯牙智能将腱绳提高到了数十万次的使用寿命。在此基础上,即便有蠕变也可以通过他们的“感知-修正”系统保持控制精度。
伯牙智能|高山S1灵巧手
同时,刘欣认为,在尽可能提高其寿命的同时,让腱绳变得更易维护、更换才是关键。
他用了一个很生活化的类比:就像吉他弦迟早会断,但没人会因为这个不买吉他,核心在于“弦好不好换”。
临界点也给出了硬核的工业级方案。
OmniHand 3 Ultra-T首创了“内置张紧机构”与定制化紧固设计,有效抑制了蠕变与冲击。
同时,其腱绳单根破断力高达1000N,配合低摩擦绳轮涂层,极大地延缓了磨损。
更重要的是,他们采用了“快拆易换”设计,将单根腱绳的更换时间压缩到了10分钟以内。
相比于一旦出故障就需要整机拆解、动辄停机数天的传统方案(如造价昂贵的特斯拉二代手),这种设计真正为产线7×24小时连续运转上了双保险。
曦诺未来|Flex 2
而曦诺未来不谈“快拆易维修”,Flex 2的开合寿命更是超过100万次(复杂工况下使用1.5~2年),同时支持主动与被动散热,腱绳抗蠕变设计,可在宽温域下稳定运行。
03.
用大小脑架构与视触融合,
接管真实世界
复杂的混合驱动结构是灵巧手的骨骼与肌肉,而让“手”活过来的,是背后的感知神经与控制系统。
在传统的工业机器人体系里,“重复定位精度”是绝对的考核指标。
因为在高度结构化的产线中,机器人只需要机械地重复同一个空间坐标系下的动作。
然而,当具身智能走向真实的非结构化环境,面对不再是标准件的物体时,这个评价体系彻底失效了。
伯牙智能CEO刘欣指出:“人闭着眼睛也无法让手指重复一百次绝对相同的角度。精细操作靠的从来不是绝对定位,而是多模态的实时反馈。”
真正的问题,永远发生在手指接触物体之后——杯子有没有滑移?布料是不是拉紧了?这要求系统从“精准重复”全面转向“实时感知与修正”。
为了实现这一跨越,业内开始全面转向“大小脑分层架构”。
在伯牙智能的这套被定义为“灵巧操作系统”的体系中,大脑负责低频的复杂规划(拿哪个物体、大概怎么走),而小脑则负责高频的底层执行。
伯牙智能|大小脑分层模型
依靠轻量化本体带来的低运动惯性(充足的刹车时间),配合0.01N的指尖触觉分辨率和1000Hz的控制频率,高山S1能在接触的毫秒级窗口内迅速做出力控微调。
这种解耦架构,避免了每一次力控修正都要等待云端大模型缓慢推理的窘境。
不仅如此,伯牙甚至在利用“不完美的数据”进行训练。
在他们看来,真实世界里一次打滑、一次差一点成功的失败抓取,同样是无价的“数据探针”,它能告诉模型物理世界的边界在哪里。
无独有偶,感知融合也成为了另外两家巨头的杀手锏。
曦诺未来Flex 2搭载了多模感知融合系统,手部不仅集成了指尖3D触觉、掌心接近觉和力觉传感器,还在腕部配备了双目深度相机。
曦诺未来|Flex 2
通过内置算法,这只手能够形成类似人类“接触反射、防滑反射、柔顺抓握”的本能级响应,显著提升复杂任务的自适应能力。
临界点同样意识到了数据匮乏是当前灵巧手泛化的最大阻碍。他们给出的答案是“视触融合”。
由于触觉信息可以视频流的形式呈现,与视觉数据同源,这能完美适配目前端到端大模型的训练需求。
OmniHand 3 Ultra-T不仅标配掌内相机原生承接第一视角数据,还实现了全手分布三维触觉感知,扫除了机器人本体的视觉盲区。
临界点|OmniHand 3 Ultra-T
此外,临界点在数据侧的积累:通过向市场交付超8000台灵巧手与上万台夹爪,近千台设备在国内零售仓、药房、工厂等地8小时连续作业,他们已经积累了超过5万小时的真实工况操作数据。
这些包含了极端光照、滑移、电磁干扰的宝贵真机数据,构成了其算法持续进化的最深护城河。
04.
不同的基因底色
尽管在技术路线上达成了混合驱动的共识,但这几家企业的创始团队基因,决定了他们截然不同的商业打法和生态卡位。
由95后创始人夏宇轩掌舵的曦诺未来,在短短一年半的时间里,累计融资金额已经逼近10亿元人民币。
资方阵营可谓豪华至极,不仅有理想战投、小米战投这样的产业巨头,还有中信建投资本、溥泉资本(宁德时代旗下)以及一众地方国资。
夏宇轩拥有物理与计算机科学双学位,曾在摩根士丹利、鼎晖投资等顶级金融机构看懂了硬科技与自动驾驶的产业潮汐。
他敏锐地察觉到,灵巧手的工程量占据了机器人整机近50%的比重,本体厂商试图全包全揽大概率会被拖垮。
因此,曦诺未来的打法是:拒绝只做零部件集成,直接瞄准“Tier 1级别供应商”的垄断生态位。
依靠来自大疆、苹果、KUKA、宁德时代等顶级大厂的数百人复合型团队,曦诺实现了从8mm无刷空心杯电机、7mm行星滚柱丝杠到运控算法的全栈自研自产。
其5400平米的新工厂将在2026年6月启动爬产,年底即可形成1万台灵巧手和20万台微型电缸的庞大产能。
这是一家从成立第一天起,就把“量产交付”刻在骨子里的硬件猛兽。
相比于资本的高举高打,伯牙智能更像是一群深谙复杂系统工程的“老兵”。
创始人刘欣曾任阿里巴巴技术总监、阿里斑马智行产品负责人、蔚来乐道的智能化产品负责人,核心团队中还包含了阿里钉钉的前副总裁、哈工大的博导以及中科大人形机器人研究院的副院长。
这种“懂系统、懂商业、懂前沿控制”的复合背景,让他们对商业化有着极其清醒的认知:绝不急于进入家庭场景。
在刘欣看来,家庭环境太复杂、容错率太低。高山S1初期的核心受众,是以科研机构为代表的“开发者用户”,以及具有明确危险性、柔性操作需求的行业客户(如远程排爆、海外高成本地区接管作业)。
当然,伯牙智能不甘心只做一个零部件供应商,而是通过兼容ROS、MuJoCo、Isaac等主流开发生态,将灵巧手打造成一个“操作能力的底层入口”:
在真实场景中一边交付、一边采集次优数据、一边迭代控制模型,让数据飞轮真正转起来。
近期,伯牙智能也已完成数千万元天使轮融资,由乾融控股领投,苏创投、熙诚致远跟投。
融资资金将主要用于高自由度灵巧手产品迭代、软硬件团队扩张,以及面向真实场景的数据和解决方案建设。
临界点的商业化策略则是用丰富的产品矩阵覆盖所有的生态位。
ICRA 2026期间,临界点还发布了全直驱旗舰灵巧手OmniHand 3 Ultra-M,这是临界点成立五个月以来推出的第四款灵巧手。

临界点|OmniHand 3 Ultra-M
Ultra-M在成人手尺寸内集成20个自由度,依托全直驱架构实现高精度力矩反馈与力控响应。
当然,他们也深知高端产品虽然性能炸裂,但难以快速普及。
因此,他们还针对人形机器人“砍手保稳定”的痛点,推出了全球最小的量产灵巧手——OmniHand 3 Lite。
这款仅鼠标大小的产品,不仅抗摔耐造(支持机器人做侧手翻等激烈运动),更将在2026年二季度量产,且其开源版本价格有望控制在惊人的300美金以内,直指教育和数十万级的大众普及市场。
而针对纯粹的工业刚需,临界点又拿出了标杆级具身夹爪OmniPicker 3。
这款夹爪不仅支持100万次带载开合、夹持力达140N,更在0.4s的开合速度下融入了0.1N的微小力控感知,真正做到了在复杂的精密装配线上“鸡蛋与钢件通吃”。
通过全栈开源架构和统一的软硬件接口,临界点正试图让自己的产品成为整个具身智能行业的基础设施。
05.
写在最后
混合驱动,会是商业上可行的终极方案吗?
当然,业内也存在不同的声音。比如在纯直驱路线上,Sharpa公司的SharpaWave就是标杆产品,被誉为「灵巧手界的劳斯莱斯」。
Sharpa|SharpaWave
该产品拥有22个主动自由度,与人手尺寸高度同构,细分配置包含15个弯曲伸展自由度、6个侧向移动自由度和1个内旋自由度,可灵活适配不同物体抓取与手内操作。
其指尖输出力超20N,手势频率达4Hz以上,搭载的动态触觉阵列让感知能力贴近人类,可完成多种精细任务,且通过100万次握持无故障认证。
尽管单只重量1200g、售价达到5万美元,但仍获得国内外顶级科技公司青睐。
这也印证了一个客观现实:目前,直驱与绳驱路线各有侧重、互有短板,当前业界最前沿的研发依然在向这两条路线的极致方向集中。
纯直驱在探索控制精度的天花板,而纯绳驱在死磕轻量化与拟人化的极限。
但是,在这个阶段,混驱在一定程度上也确实解决了技术理想与商业现实之间极度错位的问题。



沪公网安备31010702008139