这两天,这个长得有点像乐高的家务机器人,在国外火了。

椭圆形的可爱脸蛋、卡通电影里的大眼睛、头顶棒球帽,白橙米相间配色——历经18个月的隐身模式(Stealth Mode),两位斯坦福华人博士创始团队打造的机器人Memo,终于揭开神秘面纱。
重要的是,它真的会家务活:收拾餐桌、清洗碗碟、折叠衣物、冲泡咖啡……



在无遥控、无剪辑的演示视频中,Memo展现了出色的家务处理能力。它能准确识别并拿起易碎的玻璃杯,将散落的餐具一一归位到洗碗机中,还能处理不同材质的袜子并叠整齐放入抽屉。
这个身高1.7米、体重约77公斤的“带帽小哥”,配备了轮式移动底盘,水平臂展0.8m,升降柱垂直可达2.1米。
全身包裹着柔软的硅胶外壳,边角都做了圆润处理,整机看不到外露的螺丝,所有面板严丝合缝,看起来简约而具有亲和力。

▍技能捕捉手套:实现零机器人数据训练
机器人圈里,高质量训练数据稀缺老大难问题,传统做法包括遥操作、仿真模拟等。而团队选择了一条独特的路径——让普通人在自己家里,通过佩戴特制手套来"教"机器人。

这副被称为"技能捕捉手套"的神器,与Memo手部有相同的几何结构和传感器套件。因此,人类戴着手套做出动作,Memo就能学着做。
每个购买Memo的用户,都能快速成为自己机器人的老师。而这套系统仅需约400美元,极大地降低了传统数采设备的成本。
团队已经向各地寄送了超过2000副这样的手套。这些手套的使用者被称为"记忆开发者",他们分布在各地的普通家庭中,在日常生活中完成各种家务操作的同时,也在为Memo贡献宝贵的训练数据。

当然,人手和机械手之间存在着天然的差异——身高不同、手臂长度不同、关节灵活度也不同。为了解决这个问题,团队开发了一套"技能转换"技术。这套系统能够对采集到的运动学数据和视觉数据进行精细化处理,自动调整和校准各种参数差异。
根据官方数据,这套转换系统的成功率高达90%。目前,团队已经收集了将近1000万条轨迹,包含行走、导航、完成长时域任务的长轨迹。

▍ACT-1基础模型:实现长程复杂的移动操作任务
如果说技能捕捉手套解决了数据来源问题,那么ACT-1模型则展现了如何充分利用这些人类数据的智慧。

ACT-1创始团队专门为Memo打造的基础模型。它是首个将长时程操作与基于地图的导航相结合的端到端基础模型,仅需输入像素或观测值,就能直接输出全身动作指令。
在一个典型的"餐桌到洗碗机"演示中,Memo能够自主行走近40米的距离,独立与21件不同物体进行33种不同操作,总计68次精细交互。
ACT-1的泛化能力也很强。研究团队特意在多个从未见过的Airbnb房源中测试Memo,即便面对完全陌生的房间布局,它依然能够顺利完成任务。
这是如何做到的?秘诀在于ACT-1独特的地图理解机制。在训练阶段,模型不是简单地记住特定房屋的布局,而是学会了如何解读3D环境地图。当进入一个新环境时,只要提供相应的3D地图,Memo就能自主规划路线,找到厨房、餐厅、洗碗机等关键位置。
除了导航和基础操作,ACT-1还掌握了一些相当灵巧的技能。比如折叠袜子——这个看似简单的动作,实际上需要精确的力度控制、多指协调以及对柔软材料形变的理解。Memo需要从一堆杂乱的袜子中挑出单个的,将其卷成球状,然后整齐地放入收纳篮。
制作浓缩咖啡这个活儿也不简单。Memo需要准确抓取咖啡机手柄,在空中完成压粉动作(精度要求达到毫米级),然后用恰到好处的力度将手柄插入咖啡机并锁定。整个过程需要视觉、力觉和运动控制的协调配合。
再如把酒杯放到洗碗机这个动作,力大了容易碎,无法对准插错位置也会碎。在20多次现场演示中,memo在这个动作中没有搞砸。

这种设计理念让Memo的动作更加自然流畅,使其能够根据实时环境做出灵活调整。
▍华人学霸背景初创团队
机器人 Memo 由两位华人学霸(赵子豪、迟宬)组建的 Sunday Robotics 团队研发。如今Sunday Robotics 团队已扩展至30人左右,横跨软件、硬件、数据、训练与模型评估等完整技术栈。

赵子豪(Tony Zhao,CEO)本科毕业于加州大学伯克利分校,师从具身智能领域先驱Sergey Levine,后在斯坦福攻读博士,师从Chelsea Finn。他曾在Google DeepMind、Tesla Autopilot以及GoogleX Intrinsic等多家核心实验室工作,是ALOHA、ACT 、Mobile ALOHA等顶级研究的核心作者,备受业界关注。2024年,他选择从斯坦福博士项目退学,投入创业。

迟宬(Cheng Chi,CTO)在密歇根大学获得本科学位,并在斯坦福大学取得博士学位,师从机器人界大佬宋舒然。他是被业界广泛采用的Diffusion policy的一作,也是具身数据集Open x-embodiment、Droid的贡献者之一。

有趣的是,这支年轻的团队在产品发布前几个小时还在社交媒体上征集机器人的名字,最终从网友的建议中选定了"Memo"这个称呼。
目前,Memo仍处于测试阶段,预计将在2026年正式推出。据悉,原型机成本在 6,000 到 20,000 美元之间。计划未来将成本降低至少5 成。
Sunday Robotics官网上有个简单却充满诗意的句子:"Mundane made magic"。
这个机器人的目标很简单,就是把周末还给人类。让人们有更多时间陪伴家人、追求爱好,而不是被困在永远做不完的家务中。