登Nature封面!索尼乒乓球机器人Ace首次击败人类精英选手,赢在“读懂旋转”

Dabaoo2026-04-241264机器人技术及应用

五名精英乒乓选手走进一个标准奥运尺寸的赛场。球台是ITTF认证的SAN-EI,球是Nittaku 40+三星球,裁判是日本乒协持证上岗的。一切按国际乒联规则来,没有缩水。

他们的对手不是人,是一个叫Ace的机器人。结果,五场三局两胜,Ace赢了三场。



 

要知道,这是人类历史上,自主机器人首次在正式比赛规则下,实打实地从人类运动员手中抢下胜场。Ace并非实验室里的发球模板,面对时速超过20米、每秒转动上百圈的极限旋转球,它不仅接住了,还回击得极为刁钻。

同时,这项成果刚刚以封面文章的形式登国际顶刊《Nature》。它用数据向世界证明,物理AI在复杂、高速的实时交互任务中,已经拥有了足以媲美人类精英的无限潜力。



 

01.

为什么“打乒乓球”件事这么难?

职业乒乓球的球速能飙到20米/秒以上,两拍之间往往不到0.5秒。更狠的是旋转,角速度可达1000弧度/秒,一个上旋或下旋能让球的轨迹完全违背直觉。球台上的弹跳还会受旋转影响,下旋球可能“飘”,上旋球可能“扎”。

自1983年以来,人类做了四十多年乒乓球机器人。但之前的方案要么用发球机喂球,要么缩小场地覆盖范围,要么干脆忽略旋转,要么禁止某些击球方式。说白了,它们打的不是真正的乒乓球。



 

所以索尼AI团队面对的问题是:不是让机器人碰到球,而是让它在完整的、对抗的、带旋转的真比赛里,跟人类高手过招。

Ace的核心突破,就是赢在稳定性和对旋转的处理能力。

02.

Ace是如何练成的?

如何做到这一点?索尼AI团队为ACE搭载了一套精密的“感知-决策-执行”链条。Ace的整套系统以1毫秒周期同步运行,与视觉系统共享时钟信号,即使在最大速度下,位置跟踪延迟仍低于5毫秒。


Ace集成了感知、控制和机器人硬件,用于打乒乓球
 

 

 

  • 感知:看懂位置,更看懂旋转

 

乒乓球场上,人类选手靠眼睛追球、靠经验猜旋转、靠肌肉记忆调整动作。Ace走的完全是另一条路,靠直接测量。

它看位置靠的是9台APS传统相机,分布在球台外围,以200赫兹的频率捕捉球的3D位置,平均误差只有3毫米,延迟10.2毫秒。

真正的核心突破,是“看懂旋转”。

Ace配备了三套凝视控制系统,每套都搭载了事件驱动视觉传感器,这种相机不按帧曝光,而是对光线变化做像素级异步响应,高速旋转物体在传统相机里糊成一片,在它眼里却是清晰的运动轨迹。

每套系统还配了一对可旋转的跟踪镜和一个远摄可调镜头,镜头会主动跟随球的移动,始终对准球体表面印着的商标。

系统用卷积神经网络和对比度最大化算法分别估算角速度,再根据不确定性动态融合,最终以400到700赫兹的频率把旋转数据传给决策层。平均测量误差24.8弧度每秒。



 

 

  • 决策:仿真中自学,比赛中调用

 

有了位置和旋转数据,下一步是决策。

Ace采用Soft Actor-Critic(SAC)算法,在仿真环境中通过试错自学回球策略。训练中,评估模块能看到真实的球状态,而决策模块只能依赖带噪声的传感器历史数据。这种“不对称”设计确保策略能从仿真顺利迁移到真实世界。

比赛时,策略每32毫秒查询一次,根据球和机器人的当前状态输出一个抽象动作,然后映射为未来32毫秒的关节轨迹。与此同时,系统会预先计算一条返回安全位置的“重置轨迹”,一旦预测到碰撞就立刻执行,保证高速运动中的安全。

为了应对不同类型的来球,团队训练了多个策略,分别掌握高上旋、下旋等技能,每个技能设定期望的落点和旋转权重。比赛时,系统根据来球特征从技能库里实时选取最合适的策略。这套思路上很像一个全能运动员,拿到什么球就调出什么技能包。

发球则单独处理。抛球动作来自人类示范,击球动作通过遗传算法优化。每种发球要经过真人陪练测试,20次尝试中失败率低于5%才能入库。最终,Ace的发球库里存了15种发球。

 

  • 执行:为速度与精度定制

 

执行层面,机械臂有8个自由度(2个直线关节+6个旋转关节),末端最高速度设定为20米/秒,工作空间覆盖3.6米×3.6米。

此外,其连杆经过拓扑优化设计减重,使用Scalmalloy高强度铝合金3D打印。末端执行器是一块改装球拍——Butterfly Dignics 05胶皮搭配VICTAS ZX-GEAR OUT底板,外加一个用来发球的小杯。

有了这套能“看懂旋转、实时决策”的系统,Ace走上了赛场。

03.

赢下精英选手,从职业选手手中拿分

2025年4月,Ace先对阵5位精英选手(三女两男,十年以上竞技经验,每周训练约20小时),三局两胜制,3胜2负,13局拿下7局。

随后对阵两位日本T联赛现役职业选手安藤南和曾根薰,五局三胜制,0胜2负,但7局中拼下1局。

数据揭示了Ace的赢法。它不靠更快的击球。Ace的制胜球和普通回球在速度和旋转分布上几乎一致,稳定回球等对手失误。而人类选手的制胜球明显高于普通回球,靠突然加力得分。

面对旋转高达450弧度/秒的来球,Ace回球率始终超过75%,远超此前报道的竞技乒乓球机器人水平。

它自己打出最高速度16.4米/秒、最高旋转600弧度/秒,也能回击对手最高19.6米/秒、867弧度/秒的来球。平均回合长度5.0拍,比人类职业比赛典型值3.9拍更长。发球方面,15种不同发球直接拿下16分,精英选手仅8分。



 

最惊艳的一幕是擦网球。球在0毫秒触网,Ace仅用49毫秒调整轨迹并成功回球。

团队做了反事实模拟:如果球没擦网,Ace的动作路径会截然不同。说明它真的是在实时决策,而非执行固定套路。



 

04.

从球桌走向更多场景

当然,Ace还远非完美。

目前它仍无法稳定击败顶级职业选手。《Nature》同期评论文章指出,Ace从多个视角同时观察场地的方式与人类存在本质差异,离“拟人化”还有距离。

研究团队自己也很清醒:真正的挑战在于如何建模人类对手的行为。在高维物理空间中精确模拟人类动作极其困难,这意味着真正的目标函数(赢或输)无法被直接用于训练,只能使用替代目标。未来如果能引入对手建模和在线学习,Ace有望在实战中持续进化。

即便如此,这项突破的意义已经超出了乒乓球本身。它为制造、服务、搜救等需要高速、精准人机协作的领域,提供了一个可验证的技术路径。机器人执行实时复杂任务的能力,正在被一步步验证。

正如1992年奥运会选手、乒乓球专家中村金次郎在看完Ace一记击球后的感叹:“其他人根本做不到。我以前认为这是不可能的。但既然它能做到……那就意味着人类也有可能。”