Sci Robot重磅:机器人学会削皮了?科学家让机器人在复杂曲面实现通用任务迁移

Ally2026-04-231264机器人技术及应用

当我们切开一根香蕉,削掉一个土豆的皮,或是清洗一个形状不规则的盘子时,我们很少会意识到自己大脑和双手的配合是多么精妙。我们能毫不费力地适应各种物体的曲面、弧度和比例,即使是第一次见到的物体也能轻松上手。然而,这项对于人类来说如同本能的日常任务,却一直是机器人领域难以逾越的鸿沟。

为什么机器人连削苹果皮都那么困难?根本原因在于,香蕉、杯子、土豆这类曲面物体,不像平整的桌面,它们没有一个全局统一的参考坐标系。在一个曲面上,“向前”或“沿着表面”的方向,在每一点都可能不同。这使得机器人很难将在一个物体上学到的技能(比如削一个直溜的黄瓜)应用到另一个形状稍有不同的物体上(比如一个弯曲的黄瓜)。机器人学到的似乎总是一套僵硬的、针对特定物体的动作序列,而非通用的“技能”。



 

近日,一篇最新发表在国际顶级期刊Science Robotics的研究,为解决这一根本性挑战带来了曙光。研究人员们提出了一种名为“扩散方向场”(Diffused Orientation Fields)的创新方法,它为机器人打造了一套能够实时适应任何物体几何形状的“智能导航系统”,让机器人拥有了在复杂曲面物体上举一反三、触类旁通的能力。



 

01.

扩散方向场:为机器人打造随形的“智能导航”

想象一下,要让机器人在一个陌生的、凹凸不平的物体表面执行任务,我们首先需要给它一张地图。传统的地图是固定的,比如一张平面的世界地图,但在曲面物体上,这张平面地图会因为褶皱和拉伸而完全失效。而“扩散方向场”则像一张具有弹性的地图,可以平滑地“贴”在任何物体的表面,甚至能延伸到物体周围的空间中。

这张“地图”是如何绘制的呢?过程出奇地简洁。机器人首先通过3D摄像头快速扫描目标物体,获得其原始的“点云”数据——即成千上万个描述物体表面形状的三维点集。接着,只需要在物体上指定几个任务相关的“关键点”(Keypoints)。例如,在削香蕉皮的任务中,关键点可以简单地设为香蕉的头和尾。

有了点云和关键点,神奇的“扩散”过程就开始了。研究人员利用了物理学中描述热量传播的“热方程”(一种偏微分方程),将关键点携带的方向信息,像一滴墨水滴入清水一样,在整个物体点云表面平滑地扩散开来。这个过程最终会生成一个连续、光滑的“方向场”。这个场为机器人提供了一个“几何支架”,在物体周围的每一个点,机器人都拥有了一个随物体表面几何形状而变化的局部参考坐标系。

简单来说,无论机器人移动到哪里,它都能立刻知道哪是贴着表面的“前进”方向,哪是“向上”或“向下”的方向。如前图所示,该方法接收点云和关键点作为输入,首先在物体表面计算出一个扩散场,然后将其无缝扩展到整个工作空间,形成一个平滑变化、无处不在的局部方向指导。

02.

解耦任务与几何:实现“一招鲜,吃遍天”

“扩散方向场”最核心的贡献,在于它巧妙地将“任务”本身与物体的复杂“几何形状”分离开来,实现了“解耦”。

过去,一个“削皮”任务对于机器人来说,可能是一长串复杂的、包含数千个坐标点的运动轨迹。换一个稍有不同的物体,整套轨迹就得重新规划或学习。而现在,借助“扩散方向场”,任务被简化为在局部坐标系下的一系列极其简单的“动作原语”(Local Action Primitives)。例如,“削皮”这个任务可以被描述为:“沿着局部x轴滑动,然后向下移动一点,再向上抬起一点”。

这套简单的指令是完全通用的,因为它不包含任何特定物体的形状信息。当机器人面对一根笔直的香蕉时,局部坐标系会引导它走直线;当面对一根弯曲的香蕉时,同样的指令会因为局部坐标系的自然弯曲,而自动生成贴合香蕉弧度的削皮轨迹。机器人需要学习和记忆的,不再是僵化的动作,而是一套抽象、通用的技能“配方”。



 

研究团队通过一系列实验,有力地证明了这种方法的有效性。他们展示了机器人在从未见过的物体上成功执行切片、削皮和表面覆盖等任务。机器人能够将一个通用的任务模型,成功迁移到香蕉、梨等多个真实物体上,其动作轨迹平滑且精准地贴合了物体表面。

为了进行更严格的量化评估,研究人员创建了50个形状各异、随机变形的梨子模型,并在上面测试了“削皮”任务的迁移效果。他们将“扩散方向场”方法与其他几种常用的机器人任务表示方法(如基于物体固定的笛卡尔坐标系、圆柱坐标系等)进行了对比。



 

结果如上图所示,一目了然。在使用传统方法时,迁移到不同形状梨子上的削皮轨迹(图C中(i)-(iii)列)差异巨大、杂乱无章(表现为图中彩色曲线周围的阴影区域非常宽)。这意味着机器人的动作一致性很差,任务成功率没有保障。而使用“扩散方向-场”的方法(图3C中iv列),50次任务的轨迹高度一致,方差极小(阴影区域非常窄),几乎就像在同一个物体上重复执行一样。这证明了该方法实现了高质量、高鲁棒性的任务迁移。

03.

从遥操作到强化学习:强大、鲁棒且通用

“扩散方向场”的价值远不止于任务迁移,它更是一个功能强大、灵活通用的“中间件”,可以无缝集成到各种机器人控制框架中,全面提升机器人的智能化水平。

研究人员展示了它在三种主流控制模式下的应用:

在遥操作中,人类操作员不再需要小心翼翼地控制机器人的每一个姿态角度。他们只需通过手柄给出“沿着表面向前”或“靠近表面”等直观指令,系统就会利用方向场自动保持工具与物体表面的正确姿态和距离,让远程操控变得更加轻松和直观。

在轨迹优化中,方向场为运动规划器提供了关于物体几何的丰富信息(梯度)。规划器可以轻松地定义“与表面保持固定距离”或“避开某个区域”等约束,并快速计算出完成复杂任务(如在物体表面绕过障碍物并到达目标点)的最优路径。

在强化学习中,它的优势更为突出。智能体可以在这个被大大简化了的、与具体形状无关的局部动作空间中进行学习,学习效率得到指数级提升。实验证明,一个在简单二维圆形上学习到的“到达-跟随”策略,竟然可以直接“零样本”迁移(zero-shot transfer)到一个复杂的、随机生成的3D点云物体上并成功执行任务,而无需任何重新训练。这在过去是难以想象的。



 

此外,该方法还表现出了出色的鲁棒性。由于“扩散”过程天然具有平滑和去噪的特性,它对传感器数据中的噪声和不完整性(如因遮挡或物体反光造成的点云缺失)有很强的抵抗力。如下图所示,即使在点云数据受到严重干扰(拓扑噪声、几何噪声)的情况下,通过调整扩散参数(增加平滑度),系统依然能生成稳定、可靠的运动轨迹。



 

此外,该方法还能轻松扩展到包含多个物体的复杂、混乱场景中,如下图所示,机器人在一堆杂物中准确地对一根香蕉进行切片操作。



 

总而言之,这项发表于Science Robotics的研究工作,通过引入“扩散方向场”这一数学工具,从根本上帮助解决机器人在曲面物体上进行通用操作的难题。它将复杂的几何适应问题,巧妙地转化为了一个简单的、可迁移的局部动作执行问题。这一框架为开发更智能、更灵巧、更能适应非结构化环境的下一代机器人提供了新思路,让我们离那个机器人能为我们削水果、洗碗的未来,又近了一步。

论文链接:

https://www.science.org/doi/10.1126/scirobotics.aea1762