Sci Robot重磅：机器人学会削皮了？科学家让机器人在复杂曲面实现通用任务迁移

Ally2026-04-231451机器人技术及应用

当我们切开一根香蕉，削掉一个土豆的皮，或是清洗一个形状不规则的盘子时，我们很少会意识到自己大脑和双手的配合是多么精妙。我们能毫不费力地适应各种物体的曲面、弧度和比例，即使是第一次见到的物体也能轻松上手。然而，这项对于人类来说如同本能的日常任务，却一直是机器人领域难以逾越的鸿沟。

为什么机器人连削苹果皮都那么困难？根本原因在于，香蕉、杯子、土豆这类曲面物体，不像平整的桌面，它们没有一个全局统一的参考坐标系。在一个曲面上，“向前”或“沿着表面”的方向，在每一点都可能不同。这使得机器人很难将在一个物体上学到的技能（比如削一个直溜的黄瓜）应用到另一个形状稍有不同的物体上（比如一个弯曲的黄瓜）。机器人学到的似乎总是一套僵硬的、针对特定物体的动作序列，而非通用的“技能”。

近日，一篇最新发表在国际顶级期刊Science Robotics的研究，为解决这一根本性挑战带来了曙光。研究人员们提出了一种名为“扩散方向场”（Diffused Orientation Fields）的创新方法，它为机器人打造了一套能够实时适应任何物体几何形状的“智能导航系统”，让机器人拥有了在复杂曲面物体上举一反三、触类旁通的能力。

01.

扩散方向场：为机器人打造随形的“智能导航”

想象一下，要让机器人在一个陌生的、凹凸不平的物体表面执行任务，我们首先需要给它一张地图。传统的地图是固定的，比如一张平面的世界地图，但在曲面物体上，这张平面地图会因为褶皱和拉伸而完全失效。而“扩散方向场”则像一张具有弹性的地图，可以平滑地“贴”在任何物体的表面，甚至能延伸到物体周围的空间中。

这张“地图”是如何绘制的呢？过程出奇地简洁。机器人首先通过3D摄像头快速扫描目标物体，获得其原始的“点云”数据——即成千上万个描述物体表面形状的三维点集。接着，只需要在物体上指定几个任务相关的“关键点”（Keypoints）。例如，在削香蕉皮的任务中，关键点可以简单地设为香蕉的头和尾。

有了点云和关键点，神奇的“扩散”过程就开始了。研究人员利用了物理学中描述热量传播的“热方程”（一种偏微分方程），将关键点携带的方向信息，像一滴墨水滴入清水一样，在整个物体点云表面平滑地扩散开来。这个过程最终会生成一个连续、光滑的“方向场”。这个场为机器人提供了一个“几何支架”，在物体周围的每一个点，机器人都拥有了一个随物体表面几何形状而变化的局部参考坐标系。

简单来说，无论机器人移动到哪里，它都能立刻知道哪是贴着表面的“前进”方向，哪是“向上”或“向下”的方向。如前图所示，该方法接收点云和关键点作为输入，首先在物体表面计算出一个扩散场，然后将其无缝扩展到整个工作空间，形成一个平滑变化、无处不在的局部方向指导。

02.

解耦任务与几何：实现“一招鲜，吃遍天”

“扩散方向场”最核心的贡献，在于它巧妙地将“任务”本身与物体的复杂“几何形状”分离开来，实现了“解耦”。

过去，一个“削皮”任务对于机器人来说，可能是一长串复杂的、包含数千个坐标点的运动轨迹。换一个稍有不同的物体，整套轨迹就得重新规划或学习。而现在，借助“扩散方向场”，任务被简化为在局部坐标系下的一系列极其简单的“动作原语”（Local Action Primitives）。例如，“削皮”这个任务可以被描述为：“沿着局部x轴滑动，然后向下移动一点，再向上抬起一点”。

这套简单的指令是完全通用的，因为它不包含任何特定物体的形状信息。当机器人面对一根笔直的香蕉时，局部坐标系会引导它走直线；当面对一根弯曲的香蕉时，同样的指令会因为局部坐标系的自然弯曲，而自动生成贴合香蕉弧度的削皮轨迹。机器人需要学习和记忆的，不再是僵化的动作，而是一套抽象、通用的技能“配方”。

研究团队通过一系列实验，有力地证明了这种方法的有效性。他们展示了机器人在从未见过的物体上成功执行切片、削皮和表面覆盖等任务。机器人能够将一个通用的任务模型，成功迁移到香蕉、梨等多个真实物体上，其动作轨迹平滑且精准地贴合了物体表面。

为了进行更严格的量化评估，研究人员创建了50个形状各异、随机变形的梨子模型，并在上面测试了“削皮”任务的迁移效果。他们将“扩散方向场”方法与其他几种常用的机器人任务表示方法（如基于物体固定的笛卡尔坐标系、圆柱坐标系等）进行了对比。

结果如上图所示，一目了然。在使用传统方法时，迁移到不同形状梨子上的削皮轨迹（图C中(i)-(iii)列）差异巨大、杂乱无章（表现为图中彩色曲线周围的阴影区域非常宽）。这意味着机器人的动作一致性很差，任务成功率没有保障。而使用“扩散方向-场”的方法（图3C中iv列），50次任务的轨迹高度一致，方差极小（阴影区域非常窄），几乎就像在同一个物体上重复执行一样。这证明了该方法实现了高质量、高鲁棒性的任务迁移。

03.

从遥操作到强化学习：强大、鲁棒且通用

“扩散方向场”的价值远不止于任务迁移，它更是一个功能强大、灵活通用的“中间件”，可以无缝集成到各种机器人控制框架中，全面提升机器人的智能化水平。

研究人员展示了它在三种主流控制模式下的应用：

在遥操作中，人类操作员不再需要小心翼翼地控制机器人的每一个姿态角度。他们只需通过手柄给出“沿着表面向前”或“靠近表面”等直观指令，系统就会利用方向场自动保持工具与物体表面的正确姿态和距离，让远程操控变得更加轻松和直观。

在轨迹优化中，方向场为运动规划器提供了关于物体几何的丰富信息（梯度）。规划器可以轻松地定义“与表面保持固定距离”或“避开某个区域”等约束，并快速计算出完成复杂任务（如在物体表面绕过障碍物并到达目标点）的最优路径。

在强化学习中，它的优势更为突出。智能体可以在这个被大大简化了的、与具体形状无关的局部动作空间中进行学习，学习效率得到指数级提升。实验证明，一个在简单二维圆形上学习到的“到达-跟随”策略，竟然可以直接“零样本”迁移（zero-shot transfer）到一个复杂的、随机生成的3D点云物体上并成功执行任务，而无需任何重新训练。这在过去是难以想象的。

此外，该方法还表现出了出色的鲁棒性。由于“扩散”过程天然具有平滑和去噪的特性，它对传感器数据中的噪声和不完整性（如因遮挡或物体反光造成的点云缺失）有很强的抵抗力。如下图所示，即使在点云数据受到严重干扰（拓扑噪声、几何噪声）的情况下，通过调整扩散参数（增加平滑度），系统依然能生成稳定、可靠的运动轨迹。

此外，该方法还能轻松扩展到包含多个物体的复杂、混乱场景中，如下图所示，机器人在一堆杂物中准确地对一根香蕉进行切片操作。

总而言之，这项发表于Science Robotics的研究工作，通过引入“扩散方向场”这一数学工具，从根本上帮助解决机器人在曲面物体上进行通用操作的难题。它将复杂的几何适应问题，巧妙地转化为了一个简单的、可迁移的局部动作执行问题。这一框架为开发更智能、更灵巧、更能适应非结构化环境的下一代机器人提供了新思路，让我们离那个机器人能为我们削水果、洗碗的未来，又近了一步。

论文链接：

https://www.science.org/doi/10.1126/scirobotics.aea1762

精彩推荐

税收数据“接住”资本热度，市场迎来“验收时刻”？

刚刚，宇树科技科创板IPO注册通过，“人形机器人第一股”进入发行倒计时

平均年龄不到25岁，清华博士团队凭什么让雷军独家押注？

为优必选、荣耀、智元代工，这家营收破500亿制造巨头即将赴港IPO

成立仅1年拿下数亿融资，深度机智凭什么让十余家机构集体下注？

精彩文章

扫码手机阅读

Sci Robot重磅：机器人学会削皮了？科学家让机器人在复杂曲面实现通用任务迁移

精彩推荐

关于我们

商务合作