Nature最新封面：AI战胜了人类世界冠军，创下最快无人机竞速记录

2023-08-3118特种机器人

人工智能（AI）再次战胜了人类冠军。这一次，是在无人机竞速领域。来自苏黎世大学机器人与感知研究组（Robotics and Perception Group）的 Elia Kaufmann 博士团队及其英特尔团队联合设计了一种自动驾驶系统——Swift，该系统驾驶无人机的能力可在一对一冠军赛中战胜人类对手。

这一重磅研究成果，刚刚以封面文章的形式发表在了最新一期的 Nature 杂志上。

图｜最新一期 Nature 封面。（来源：Nature）

第一人称视角（FPV）无人机比赛是一项电视转播的运动，专业参赛者通过 3D 电路驾驶高速飞机。每个飞行员都通过机载摄像头的视频从无人机的角度观察环境。使用自主无人机达到专业飞行员的水平具有挑战性，因为机器人需要在其物理极限下飞行，同时仅通过机载传感器估计其在电路中的速度和位置。这里介绍 Swift是一个自主系统，可以在人类世界冠军的水平上与物理车辆比赛。该系统将模拟中的深度强化学习（RL）与物理世界中收集的数据相结合。 Swift在现实世界的正面交锋中与三位人类冠军竞争，其中包括两个国际联赛的世界冠军。 Swift赢得了与每位人类冠军的几场比赛，并展示了最快的比赛记录时间。这项工作代表了移动机器人和机器智能的里程碑。这可能会激发在其他物理系统中部署基于混合学习的解决方案。

在这场无人机比赛中，人类操纵者通过机载摄像机操纵无人机通过 3D 赛道，这是为了让操纵者从无人机的视角观察环境。自主无人机要达到人类控制无人机的水平是非常具有挑战性的，因为无人机需要仅通过机载传感器估计其在赛道中的速度和位置。

而 Swift 战胜的是世界冠军级人类玩家，他们分别是：2019 年无人机竞速联盟世界冠军 Alex Vanover、两届 MultiGP 国际公开赛冠军 Thomas Bitmatta 和三届瑞士全国冠军 Marvin Schaepper。

下图 1a 是这次比赛的赛道，Swift 不仅赢得了与人类冠军的比赛，还创造了最快的比赛纪录。这项工作是移动机器人和机器智能领域的一个里程碑。

图 1

下面我们就来看一下自主无人机 Swift 的技术方法。

Swift 技术介绍

Swift 是一个仅使用机载传感器和计算完成自主控制的四旋翼飞行器，由两个关键模块组成：

感知系统，将高维的视觉和惯性信息转换成低维表征；

控制策略，摄取感知系统产生的低维表征并产生控制命令。

其中，控制策略由一个前馈神经网络来表征，并使用无模型 on-policy 深度强化学习（RL）进行训练。

由于模拟与现实世界在传感和动力学方面存在差异，仅在模拟中优化策略会导致无人机的现实性能较差，因此研究团队利用物理系统收集的数据来估计非参数经验噪声模型（non-parametric empirical noise model）。实验表明，这些经验噪声模型有助于将控制策略从模拟成功转移到现实。

具体来说，Swift 将机载传感器的读数映射成控制命令，这一映射包括两部分：(1) 观察策略，将高维的视觉和惯性信息提炼成特定于任务的低维编码；(2) 控制策略，将编码转换成无人机命令。Swift 系统整体概览如下图 2 所示：

图 2

如图 1 所示场景，Swift 的观察策略需要运行视觉 - 惯性估计器和门检测器。其中，门检测器是一个卷积神经网络，用于检测机载图像中的赛车门，然后使用检测到的门来估计无人机在赛道上的全局位置和飞行方向。这是使用相机后方交会算法（camera-resectioning algorithm），并结合赛道地图来完成的。最后，Swift 用卡尔曼滤波（Kalman filter）将全局姿态估计（从门检测器获得）与视觉 - 惯性估计结合起来，从而更准确地表征机器人的状态。

控制策略（用一个两层感知器表征），负责将卡尔曼滤波（Kalman filter）的输出映射成无人机控制命令。控制策略在模拟中使用无模型 on-policy 深度强化学习（RL）进行训练。在训练期间，该策略会考虑相机视野内下一个竞赛门的信息，将奖励最大化，以提高姿态估计的准确性。

实验及结果

为了评估 Swift 的性能，该研究进行了一系列的比赛实验，并与轨迹规划和模型预测控制（MPC）进行了比较。

如下图 3b 所示，在与 A. Vanover 的 9 场比赛中，Swift 赢了 5 场；在与 T. Bitmatta 的 7 场比赛中，Swift 赢了 4 场；在与 M. Schaepper 的 9 场比赛中，Swift 赢了 6 场。在 Swift 记录的 10 次失利中，40% 是因为与对手相撞，40% 是因为与竞赛门相撞，20% 是因为比人类控制的无人机慢。总体而言，在与人类控制无人机进行的比赛中，Swift 获胜次数最多，并且它还创造了最快的比赛纪录，比人类控制无人机（A. Vanover）的最佳时间快了半秒。