专访橡木果:别卷VLA了!本能驱动才是具身智能真王炸

风车车2026-06-032751机器人技术及应用

第一道坎儿是路线依赖症,成为普遍困境。

今年以来,具身智能圈里流传着一个略显尴尬的杜撰段子:一个VLA模型在演示现场,被指令“把桌上那个橙子递给我”。机械臂流畅地探过去,精准地握住了一只玻璃杯。全场瞬间安静。工程师额头冒出汗,慌忙在平板上敲字:“重新定义橙子”。

过去大半年,这类现场翻车的段子层出不穷,主角从国内估值顶流的几家独角兽,到大洋彼岸的Figure AI、Physical Intelligence,几乎无人能免。

就在两年前,整个行业还在为VLA(视觉-语言-动作模型)这条技术路线高声站台。Covariant的RFM-1刚亮相时,媒体几乎要把“通用机器人奇点降临”的标签直接贴在它身上。谷歌DeepMind的RT-2论文发布后,二级市场的分析师们连夜修改研报,直接把具身智能的商业化落地时间提前了整整三年。

可时至今日,具身智能正站在技术路线分岔口,海量资本与企业涌入,却困在数据依赖、泛化不足、落地艰难的死循环。

而今天,橡木果机器人却以一种全新的称为【本能驱动】的技术路线,开辟了除VLA和世界模型之前的第三条路径,以自下而上而非数据驱动的方式,让机器人在物理世界自主涌现操作智能,为行业打开量产与通用化的新大门。



 

01.

具身智能迎来拐点

具身智能大致正处于1.0阶段到2.0阶段的转变中,1.0阶段整个行业更加注重产业链的构建,产品的定义以及发布。在此阶段,资本热钱快速涌入,企业主体如雨后春笋崛起,各类技术创新井喷式爆发。

随着具身智能迈入2.0阶段,国家层面的政策体系不断完善,对具身智能尤其是人形机器人的标准化体系日渐落地,与此同时,具身智能产品也开始从春晚舞台走进工厂等各类场景。

不难发现,在资本与政策双重加持下,具身智能迈入爆发临界点。

公开资料显示,2025年国内行业融资近370亿元,同比增长260%,全年融资事件超300起,单笔融资突破10亿元成常态。政策将具身智能列为未来产业重点,多地设立千亿级产业基金,推动技术从实验室走向产线。

市场层面,中国具身智能规模2025年达9150亿元,2026年有望破万亿,人形机器人进入规模化放量阶段。

橡木果的观点是,虽然具身智能产业涌现了越来越多的玩家,但这个赛道当前并非“百机大战”,而是“百态大战”,与智能眼镜的同质化竞争不同,行业正处于技术路线探索阶段。

橡木果表示,智能眼镜技术路线收敛、核心是参数堆叠,而具身智能路线差异显著,有人走纯VLA端到端路径,有人采用分层架构,目前尚无路线被验证为唯一正解,真正的竞争尚未开启,唯有实现超越人类的基础操作能力并落地量产,才会形成稳定竞争格局。

至于后续行业关注的机器人量产与智能化竞争。相关专家认为,其实目前具身智能要发展得更好,不只需要专属通用大模型。

具体看,大模型作为“大脑”负责任务规划,但缺乏稳定可靠的“手”即操作执行能力,再强的规划也无法落地。物理世界任务的稳定完成,依赖任务规划大模型、通用操作执行模型与机器人本体协同,三者缺一不可,在其中,橡木果机器人聚焦操作执行模型,保障任务可靠落地。

执行层面的灵活性和实用性确实关键,参考过去的汽车工业以及电子消费工业,虽然近来也陷入参数堆料和同质化竞争,但能真正领先的大多需要在系统、芯片或者智驾等有核心独创技术。同样,具身智能行业玩家几百家,也只有拥有真正相对核心的技术才能率先跑出商业化成功典范。

“橡果机器人的核心竞争力源于系统级差异。从神经科学与力学底层定义‘操作本能’,回答机器人如何自主学会操作;自研触觉感知、本能决策、通用技能与末端执行全链路,形成技术闭环,已在工业场景完成商业化验证,解决传统方案难以应对的冷启动与物料适配问题,快速实现大厂POC与产能量产,这一底层认知与落地能力是最难复制的壁垒。”团队表示。

公开资料显示,橡木果2024年底成立,团队源自清华与哈佛,深耕操作领域十余年,2017年提出本能驱动路线,近年启动商业化,半年完成大厂POC验证,订单突破500万元,成为北京市创新型中小企业。

其实无论从什么角度看,复盘过去几年具身智能发展历程,行业都已经从“讲故事”转向“交答卷”,交付能力成估值核心锚点。因为过去企业拼参数、融资金,现在工业客户看重7×24小时稳定运行、复杂场景适配与真实降本增效。

显然,拐点已至,行业不再是实验室秀场,而是商业化战场。谁能破解落地难题,谁就能占据赛道主导权。

02.

迈向高质量,机器人仍在负担里

回过头来看,虽然整个具身智能和人形机器人行业热度高涨,却被三重枷锁束缚,难以迈向高质量发展。

主流VLA路径用大模型+大数据自上而下训练,把任务与硬件耦合在黑箱里。数据需求呈指数级爆炸,操作涉及多模态信息,数据量远超语言模型范畴,没有企业能覆盖所有场景。硬件差异导致模型无法预训练,同款夹爪细微差别就会让参数失效。加之一些产品的视觉无法感知滑移、重心等力学信息,出现“眼睛学会、手做不到”的尴尬,稳定性难以满足工业要求。

可落地“最后一公里”却迟迟难以打通。

因为机器人要实现量产,需要大脑、执行与本体协同。现有的深度学习以及模型解决任务规划,但操作执行能力缺失,再强规划也无法落地。

工业机器人可以按照预定的逻辑,在工业流水线上操作设备,客户对它的诉求是高效率的、固化式的重复机械劳动,比如车企生产间的搬运、涂装等工序。只要你的产品在机器臂等硬件材料上符合要求,然后基于深度学习、遥控操作等技术,机器人内置的传感器能快速理解模块化任务需求,这时候人们将事先定义的答案交给机器去学习,比如人类通过大量的数据训练,机器就能记住相应的知识模块,从而进行产生模仿的行为。跳舞也好,工厂里面的简单的搬运也好,就是这个道理。



 

的确,稍微复杂些的工业场景会十分考验机器人的能力,与一般简单的搬运操作作业不同,现实世界中许多大工厂换产频繁、物料多样,传统方案调试周期长、成本高。多数企业停留在实验室演示,面对陌生物体与工况,无法冷启动作业,量产只能是空谈。

另外,核心壁垒缺失制约行业进阶。具体来看就是触觉感知重视不足,企业多用简单力传感器或纯视觉判断;端侧实时决策能力薄弱,依赖云端大模型导致延迟;行业没有统一底层系统,感知、决策、执行链路割裂。

上述这些问题让机器人只能在特定场景演示,无法跨平台、跨任务泛化,距离通用化目标遥远。而一旦行业陷入“热而不实”的困境,硬件迭代快,智能水平跟不上,数据成本高,落地效率低。破局关键,是跳出原有路径,回归物理世界本质,找到更简洁、稳定的技术方案。

03.

行业需要破局者,回归本能驱动

当行业陷入内卷,橡木果以本能驱动成为破局者,走出VLA与WAM之外的全新路径。

橡木果的创新,源于对操作本质的重新认知。

如何理解?

人类不用学习就会抓取,这是与生俱来的操作本能,由触觉刺激直接触发,不受环境影响。橡木果以此为起点,不教机器人模仿动作,而是赋予本能,让其在交互中自主长出操作能力。

橡木果机器人走出了一条与行业主流截然不同的本能驱动技术路线,不依赖海量数据模仿,而是让机器人像人一样,靠本能在物理世界中自主学会操作。

主流VLA路线用大模型与大数据“自上而下”教机器人,就像让孩子死记硬背所有动作,数据需求爆炸、换个物体就失灵,还只能靠视觉“看”,摸不出软硬、重心与滑移,很容易抓不稳、掉东西。

橡木果从神经科学得到启发:人类不用学就会抓握,这是操作本能。团队以此为核心,把“任务规划”和“操作执行”彻底解耦,大脑负责想,手负责做,各司其职。



 

机器人的核心是端侧本能模型,自带定向、探索、执行三大本能。碰到没见过的物体,不用训练、不用标注,靠触觉直接响应,毫秒级调节力度,能自动探索稳定抓法,薄卡片、软胶球、重心不稳的瓶子都能稳妥抓取,实现零数据冷启动。



 

触觉是这套系统的基础。橡果自研高精度触觉传感器,能感知力、变形、滑移,判断软硬、重心、材质,让机器人拥有“真实手感”,而不只是靠眼睛猜。



 

在本能之上,机器人通过实操形成肌肉记忆,再用触觉数据增强视觉理解,练成通用操作技能,实现跨设备、跨任务快速迁移,从“一上来就会”变成“一上来就熟练”。



 

这条路线更稳定、泛化更强,已在汽车新能源、快消、生物医药等柔性产线落地,快速完成POC并量产,为机器人提供即插即用的通用操作能力,成为具身智能领域的全新范式。

总结下来,技术架构上,橡木果将任务规划与操作执行解耦。其任务规划由云端大模型负责,橡木果专注操作执行,形成大脑与手协同工作。核心是端侧自主决策模型Natus,包含定向、探索、执行三大本能,覆盖操作底层规律。定向本能引导末端靠近物体,探索本能让机器人自主寻找稳定抓取方式,执行本能以滑移最小化为目标,实时调节力度。



 

而且这套系统实现零数据冷启动,无需训练、标注与微调,即插即用。面对身份证、软胶球、重心偏移的瓶子等陌生物体,机器人能自主探索稳定抓法,毫秒级响应,适应不同硬件与工况。触觉是能力底座,橡木果自研多模态传感器,精准感知力、变形、滑移,判断软硬、重心、材质,让机器人拥有真实手感。

长期来看,橡木果要成为具身智能的通用操作系统,任何机器人搭载其末端,就能获得冷启动、自适应操作能力。

一切伟大突破,皆发于种核。

橡木果以本能为种,深耕操作底层,用自下而上的创新,打破行业路径依赖。在大模型、大数据、大算力的热潮中,回归物理世界第一性原理,让智能在真实交互中涌现。这不仅是一家企业的技术选择,更是具身智能走向通用化、量产化的未来方向。当机器人拥有与生俱来的操作本能,物理世界的智能化变革,才真正拉开序幕。