对话「豆脚」创作者同济子豪:人形行业为什么依然需要搞抽象?

2026-04-251326机器人技术及应用

采访“同济子豪”,是在马拉松结束后的几天。他的B站视频刚过了百万播放,评论区还在持续沸腾。

「豆脚」这个创意,是怎么来的?

“腿音火了之后,我们正好看到一个豆脚的表情包,经过两天的三维建模和3D打印,以及贴头发,就在大赛前一天,把它真正安在了机器人上。”同济子豪对机器人大讲堂介绍道。

他说这话的语气,轻描淡写,好像只是做了一件很普通的事情。



 

但这件普通的事情,上了抖音热榜,被人民日报等媒体账号转发,让无数对机器人毫无概念的普通人,第一次真正感受到了具身智能的存在。



 

当时,半程马拉松的起跑线上,一群人形机器人正蓄势待发。它们来自荣耀、宇树、松延动力,每一个都是融资数亿、技术参数拉满的正规军。

然而,当选手们纷纷开跑后,机器人半程马拉松的起跑区里,人群中却再次突然骚动了起来。

一台脑袋直接长在腿上的机器人晃晃悠悠地走了出来,没有躯干,没有手臂,脑袋上顶着一个憨态可掬的二次元表情包。

有头无脖,踩着订书机跑步——这是网友对这款最形象的调侃。网友因此给它起名:「豆脚」。

比赛还没结束,这款人形机器人已经冲上热搜。而它连正式报名其实都没赶上,只是在起跑区遛了遛。

但整个马拉松赛场,也在这一刻,从一场严肃的科技竞赛,变成了一场全民围观的具身智能嘉年华,各大媒体主动来联系。那些真正跑得快的机器人,反而没有一台获得同等量级的关注。

这是一个行业很奇妙的事件,也使得“抽象”在这个时代,突然变得比技术更稀缺。

01.

从黑客松到半马:一场意外的出圈

「豆脚」的诞生充满巧合。

2026年初,同济子豪带着高擎动力的小派机器人参加小红书黑客松巅峰赛。隔壁展位,有人带来了二次元KIG(皮克斯动画风格的动漫头壳),这类头壳以前造价四五千元,只有核心二次元玩家才玩得起。

但现在,李明威等人通过AI生成三维模型+消费级3D打印,把成本打到了998元。

同济子豪灵机一动,把腿音这个抽象的表情包头像做成头壳,安到小派身上,3D打印的头壳尺寸严丝合缝,完美卡上。



 

在这个基础上,才有了在比赛开始前40小时才诞生的「豆脚」。

那么,回到那个被问了无数次的问题:跑得最快的机器人,为什么没有「豆脚」火?为什么出圈的偏偏是它?

同济子豪的回答很直接:“亦庄半马本质上已经是一个文旅活动,不是纯技术评测。”

“KG头壳本来就是二次元小圈子的东西,经过这次马拉松,经过IP联动,全国人民都知道了原来这东西可以这样玩。这就是破圈。”他介绍道。

而机器人大讲堂认为,更深层的逻辑是,具身智能行业面临严重的专业壁垒与大众认知之间的错位。

普通人看不懂关节模组的扭矩参数,看不懂强化学习的步态优化,但能看懂一个表情包长在腿上、踩着碎步跑马拉松的画面——然后觉得有点意思,顺手转发一下。

这不是「豆脚」的胜利,这是整个行业传播基础设施薄弱的缩影。宇树王兴兴有句话流传甚广:机器人大脑还不通用,还需要再给行业一些时间。

但时间能解决技术问题,解决不了认知问题。这也意味着,在人形机器人真正走进千家万户之前,市场教育其实还有很长的路要走。

02.

「超级个体」时代:两个人能造一台机器人

那么这个路现在是否出现了捷径?

其实同济子豪的「豆脚」故事里,还有一个被忽视的细节。

在「豆脚」项目的配置中,仅仅是两个人,两三天花了四千块搞定的,剩下的工作都是用开源算法和消费级硬件拼装。

而同济子豪本人是同济土木工程专业,大四才开始自学编程。曾是高擎动力生态合伙人,微软MVP,如今是B站30万粉丝的科技博主。



 

在采访中,他把它这种更快的生产节奏,总结为一个概念:「超级个体」。“在这种时代下,AI让年轻人可以单人成军。只要你稍微有一点创意,就能够惊艳世界。”他介绍道。

这并非夸张。2024-2026年,人形机器人的开源生态快速收敛。例如同济子豪用的小派(高擎动力),这种万元级双足本体,已经URDF模型、CAD图纸、开发文档全公开,这就大幅降低了开发门槛。

更关键的一个细节是,机器人的功能,也支持更快地二次创作。同济子豪介绍,与外界想象不同,豆包这个头壳,在技术上对机器人的影响几乎为零。

小派有非常强的强化学习实时抗扰算法。里边的陀螺仪实时感知姿态,强化学习和神经网络实时输出下一个时刻全身12个电机的目标位置,通过PD控制一秒钟实现60次推理。就算上面坐一个小孩儿都可以,加一个头壳对它来说几乎没有任何影响。



 

这背后的关键技术,是训练时的域随机化。在仿真环境里,可以给机器人施加各种各样的扭矩和力,让它在不同重量和负载下都能稳定。然后再把训练好的算法Sim to Real迁移到真实机器人上,机器人就具备了抵抗各种干扰的能力。

这套逻辑,和春晚机器人背后的逻辑本质上没有不同,区别只是换了一个更小的迁移主体。

同济子豪就曾在B站发了一条视频,介绍如何在一下午内用GMR重定向+伯克利开源算法,让小派实现跌倒后自动起立、任意音乐下跳舞,整套流程,证明了这种个人开发创作已经能够跑通。

「豆脚」的爆火,恰恰意味着当大厂还在烧钱拼参数的时候,超级个体们已经开始用开源工具制造惊喜了。

03.

顺着马拉松往深处看

当然,「豆脚」出圈之后,一个更深的问题浮出水面:人形机器人行业,真的准备好走向大众了吗?

从技术上来看,确实呈现出这种趋势。

亦庄机器人半程马拉松,已经是第二届了。

相比去年的跌跌撞撞、勉强能跑,今年的赛场上,三大变化肉眼可见。

第一个变化:速度。本届大赛最亮眼的选手,是荣耀那台红色机甲机器人。它在赛道上呼啸而过,飞驰的身影让现场观众倒吸一口凉气,同时它也打破了人类半程马拉松的记录。



 

在同济子豪近期与荣耀工程师的对话中介绍,这台机器人的设计细节藏着很深的工程智慧,上半身头和身体融合为一体,避免脖子在高速运动中断裂的风险;腿部采用菱形切面,降低风阻;21公里期间,关节模组要经历5万次高速重载摆动,胯骨使用了尺寸最大的关节模组承担最大负载。

另一组让人印象深刻的选手,是智身科技的刀锋战士,这是一台使用弹性储能腿的机器人。它最大的技术难点,是在仿真虚拟环境中精准模拟出弹性腿的力学特性,再通过Sim to Real迁移到真机上。

第二个变化:自主。今年亦庄半马,参赛机器人超过100台,自主导航(不依赖遥控)的比例接近四成。

同济子豪也发现,自主赛队主要分两种技术路线:一种是使用千寻位置的定位定向终端,接两个天线,赛前记录轨迹经纬度,赛中让机器人自主寻迹;另一种更有意思,是流行科技的3D高精地图方案,即先让工程师举着扫描仪把参赛路线的点云地图扫描下来,像举着奥运火炬一样,然后让人形机器人像扫地机器人一样SLAM建图、定位、导航、规划、避障。

他们还发布了一款叫One One的空间记忆模组,在小盒子里端侧运行SLAM,不消耗机器人本身的算力,相当于外置的海马体。这使得机器人眼里的赛道,是由图像点云、深度图构成的三维世界。即便在没有GPS信号的隧道里,1公里的定位误差也能控制在几十厘米之内。

第三个变化:小型化与平民化。同济子豪所在的战队,是高擎动力海派兄弟战队。他们基于高擎动力的双足机器人本体,打造了奶瓶小鼻嘎机器人等一套大赛吉祥物天团。这些机器人有一个共同的标签:穷学生也能玩得起。



 

在解释这种现象的原因时,同济子豪认为,这是由于产业链愈发成熟,各类功能都可以找到成熟供应商。在算法层面,一些开源算法,让小公司和个人开发者也能复制和跑通。

例如伯克利廖洽源老师开源的Beyond Mimic这套开箱即用的代码,奠定了训练机器人做任意动作的最佳实践。训练之后,哪怕在机器人跳舞的时候踹倒他,他也能瞬间站起,接着奏乐,接着舞。

例如亚马逊FR团队杨麓洁老师发布的Odin1系列,让春晚的登墙、后空翻、翻越障碍物,甚至搬运箱子,都可以用开源算法实现。她在春节期间还发布了PH Parker,给机器人接上深度相机,机器人就能自主决定接下来要跳台阶还是爬高台,无需预设动作,无需固定场景。

还有例如香港科技大学和上海人工智能实验室开源的Human X,只需要一段人类视频,就能训练出对应的物体交互技能。当人类挥舞拳击手套或者假装要投篮,机器人会出现本能直觉一样的应激反射,主动和人类博弈。



 

而且最近一年,正涌现出了不少优秀的开源人形机器人本体,比如天工、高擎动力小派和派加,还有前阵子非常火的萝卜派对机器人。这意味着普通企业和个人玩家也能开始玩出创意。

同济子豪说这些话的时候,语气里带着一种笃定,他用自己的经历证明,一个两三个人的小团队,依靠开源平台和一点稍微惊艳世界的创意,就能在巨头林立的赛道中破圈而出。

这意味着,我们即将迎来人人都可以手搓人形机器人的时代。对于所有有志于此的人来说,一个残酷又迷人的事实是,机器人的一切已经开始准备好,它缺的,可能正是那点能够惊艳世界的抽象品味和创意。

这也使得所有的东西,其实都值得用机器人和AI重做一遍。因为这其中,总会有一个属于具身智能的ChatGPT时刻。

04.

结语与未来

采访尾声,子豪描述了马拉松结束时的一个场景:大家都开始忙着撤场,终点线那突然爆发了一场柳絮和花粉风暴,所有人眼睛睁不开。

“我们也临时找了个帐篷躲进去。”子豪自嘲道,“机器人也害怕过敏。”这大概是具身智能行业最真实的一个瞬间,技术奔跑在通往全自主的路上,而现实里,连花粉却能让所有人选择暂停。

但第二天,太阳照常升起,机器人行业会继续奔跑。

这就是这个行业最可爱的地方。