完爆Figure!全球首个具身Agentic OS问世!中国机器人实现「边思考边干活」

Ally2026-01-121531机器人技术及应用

刚刚,全球首个让机器人实现“边思考边干活”的具身Agentic OS正式发布!背后团队,正是来自中国深圳的逐际动力(LimX Dynamics),系统命名为LimX COSA(Cognitive OS of Agents)。


话不多说,直接上效果。搭载该系统的全尺寸人形机器人Oli,在一段无遥控、全自主、原速播放的视频里,展现出惊人的连续自主作业能力,率先成为兼具高阶运动智能与复杂认知能力的“人形智能体”!



 


这项成果的重大意义在于,它从根本上解决了当前具身智能领域“知易行难”的核心痛点。它突破了传统机器人只能被动、分步执行预设程序的局限,让机器人质变为能够自主理解任务、适应真实物理世界并可靠完成作业的智能体!


这也意味着,行业最新趋势正从关注模型能力,转向关注OS系统能力,并为行业从技术Demo迈向真正的产品交付铺平了道路。逐际动力认为未来的操作系统(包括手机、计算机)都将是agentic的,COSA正是为人形机器人量身打造的、面向未来的Agentic OS。


搭载COSA的全尺寸人形Oli初次唤醒
 


在全球具身智能的激烈竞争中,这一成果的独特性尤为凸显。与其他玩家将“通用大脑”简单嫁接到机器人身上不同,COSA选择了一条更接近生命智能本质的路径——从设计之初就将机器人本体与物理世界深度绑定,实现认知与行动的实时闭环。

这种差异在全球竞争格局中表现得尤为明显。例如,近期备受关注的Figure发布的Helix本质上是一个强大的模型,而逐际动力的COSA是一个完整的操作系统。打个比方,如果Helix是一个功能强大的App,那COSA就是Android/iOS级别的系统平台,不仅能承载无数应用,还原生具备驱动物理AI的Agent能力。

这种底层架构的差异,直接体现在实际表现上:Helix的Demo仍是"移动归移动、操作归操作"的分段式演示,而搭载COSA的Oli已经实现了"移动-操作-移动"的连续作业,真正做到一镜到底的"边想边做"。


左:Oli人形机器人 右:Figure人形机器人
 

 

这种连续性,恰恰是逐际动力追求"服务于人"最迫切需要的核心能力。

那么,这个开创性的OS,技术上究竟是如何实现的?别急,我们为你一一拆解。

▍具身Agentic OS解密:如何构建“大小脑融合”的物理世界原生系统?


长久以来,机器人的“认知”(大脑)和“运动”(小脑)是分裂的。


这种割裂,导致了传统机器人“单一指令对应单一动作”的线性束缚,难以适应真实世界的复杂性和不确定性——比如,行走路径上突然出现的同事、执行任务途中收到的新指令、需要拿取的物品被意外遮挡,或是需要同时处理多个优先级不同的待办事项。


而具身Agentic OS的核心,就是要弥合这条鸿沟,为机器人构建一个完整的“神经系统”,实现真正的“知行合一”。


LIMX COSA
 


为了实现这个目标,具身Agentic OS采用了自底向上的三层精密结构:

底层:小脑基础模型(Whole-Body Control Foundation Model)


这是“小脑”的核心,是所有智能的基石。一个高鲁棒性的全身运动控制系统,为机器人提供稳定、可靠、高鲁棒性的原子动作,确保机器人能实时做出任意全身动作,而不是依赖预先训练的单个动作。


行走、平衡、抗扰……这一层确保了机器人“行得稳、动得准”,保证了上层决策不会因为一个简单的物理动作失败而全盘崩溃。

中层:大小脑融合的高阶技能层


在原子动作的基础之上,具身Agentic OS构建了一个至关重要的高阶技能层。这一层是连接高阶认知(大脑)与底层运控(小脑)的核心枢纽,其关键任务在于打通大模型与全身运控基础模型之间的对齐,从而实现“大小脑”的深度融合。


为此,系统将经过大量可靠性训练的动作,形成一个模块化、可复用的多元技能工具箱。工具箱中的每一项技能都具备环境感知与适应能力,并支持独立迭代与灵活的组合调用,为实现导航、避障、抓取乃至上下楼梯等复杂行为提供了可靠支持。


搭载COSA的全尺寸人形机器人Oli基于实时感知自主上楼梯
 

 

上层:赋予机器人灵魂的自主认知与决策


这是“大脑”的体现,是整套系统的灵魂,主要涵盖交互、记忆与思考。


通过集成多种基础模型与先进的Agentic原生决策机制,具身Agentic OS能够对中层的海量技能进行统一的调度、协同与规划,管理所有模型、技能、工具、记忆、存储等,最终实现一个完整的智能闭环。


视频中的高能时刻,正是这一层能力的体现:

 

  • 长程任务拆解:收到“拿两瓶水到前台”的指令后,Oli自主将其拆解为:1.找到水箱 -> 2.取两瓶水 -> 3.前往前台。

 

 

  • 多任务处理与动态优先级排序:途中遇到同事请求送快递,Oli立刻进行“推理决策”,判断新任务的可行性,并“重新确定任务优先级”,决定先完成紧急的待客任务,再处理快递,并与同事进行语言确认。这就是「边思考边干活」的核心体现。

 

 

  • 复杂情境下的自主规划:发现快递被箱子遮挡,Oli没有等待指令,而是自主“任务规划”,生成“先搬箱子,再取快递”的解决方案,并完美执行。

 


搭载COSA的全尺寸人形Oli 连续操作:移除遮挡物后,取目标快递
 

 

 

  • 主动感知任务:途中看到地上的废弃纸杯,Oli主动生成了“捡起来扔掉”的额外任务。这种主动维护环境的意识,标志着它已具备超越指令本身的目标驱动能力。

 


搭载COSA的全尺寸人形Oli完成移动操作:捡纸杯
 


这套三层结构,正是具身Agentic OS作为“枢纽”级系统的精髓所在。它并非重复造轮子,而是率先在全球行业内,将运控、技能规划、认知决策等技术深度融合,实现了从“单点技术成熟”到“全局能力一体化”的质变。

▍三大核心能力,赋能真实世界


传统机器人“能动”,大模型加持下开始“能想”,但要在物理世界里“边思考边干活”,却极其困难。


搭载具身Agentic OS的机器人之所以能做到,背后是三大核心能力在起作用:


一、基于物理逻辑的高阶认知与推理能力


COSA的顶层设计,让机器人拥有了面向真实世界任务的深度逻辑能力。当接收到自然语言指令时,它并非简单匹配关键词,而是进行深度语义理解与意图识别,自主地将长程任务动态拆解为一系列可执行的子任务。更关键的是,这个过程具备基于价值判断的动态优先级调整能力,例如:


家庭场景:当机器人正在准备晚餐时,若听到婴儿哭声,它能立刻判断“照顾婴儿”的优先级高于“准备晚餐”,从而暂停当前任务,优先处理更紧急的人类需求。


商用场景:在商场中,一个巡逻机器人侦测到少量垃圾,但同时收到高优先级的火警警报,它会果断放弃“清扫”的低优先级任务,将“前往警报点核实”作为最高优先级。


搭载COSA的全尺寸人形机器人Oli检测到打印机没纸
 


二、构建世界观的语义记忆与主动感知能力


一个无法记忆和理解世界的机器人,永远只能被动地响应瞬时指令。COSA通过构建跨时间、跨模态的感知与记忆系统,赋予机器人对物理世界的持续认知能力,使其能够对环境、对象、与人的交互历史进行语义记忆和建模,从而构筑起自己的“世界观”。


这意味着机器人不仅“记得”去过哪,更“记得”物品的归属、状态和人的习惯。例如,它能记住“我的杯子”特指书房那个蓝色马克杯,也记得用户习惯下午三点喝咖啡。


更重要的跨越在于,它实现了从“被动接受输入”到“主动感知探索”的转变。当信息不足以决策时,它会主动观察或提问以获取信息。这种主动性,是机器人从被动工具向主动智能体演化的关键特征。


搭载COSA的全尺寸人形机器人Oli主动关注同事身体情况
 

三、基于实时感知的全身移动操作能力


这是将高阶认知转化为稳定物理交互的关键,也是COSA与许多演示型机器人拉开差距的地方。它实现的,是一种告别“剪辑智能”的、一镜到底的连续作业能力,是“大脑 + 小脑”一体化能力的终极体现。例如:


商业场景:在人流密集的商场,机器人端着咖啡配送。当迎面走来顾客时,它不仅会规划出流畅的避让路径(大脑),更会同步微调全身姿态以保持上身稳定(小脑),确保咖啡不会溅出,将“安全通行”与“平稳运送”两个目标并行完成。


家庭场景:在给植物浇水时,若感知到主人走近,它会在不中断任务的前提下,微调站位和水流角度,避免弄湿主人,将“完成浇水”和“避免影响主人”两个任务并行处理。


搭载COSA的全尺寸人形Oli完成移动操作:扔纸杯进垃圾桶
 

▍中国物理AI再进化:定义具身智能新范式

逐际动力发布的COSA这一具身Agentic OS,代表了具身智能发展路径的根本性突破。

背后支撑这一切的,是逐际动力的全栈技术体系:从本体硬件设计、运动控制的"小脑"系统,到认知决策的"大脑"能力,再到最关键的大小脑深度融合的系统——每一层都是自主研发,形成了完整闭环。
 



 

全尺寸人形机器人 Oli 在 COSA 系统的驱动下,率先成为兼具运动智能和高阶认知的人形智能体

这标志着继多形态双足机器人TRON 2代表中国原创力量之后,中国物理AI再次进化,逐际动力再次做到定义领先。


这不仅是中国企业在前沿科技上的原创自信,更是为全球具身智能的发展提供了来自中国的关键解法与核心动能。


2026年,人形机器人商业化落地的序幕,正由这样的底层创新拉开。