随着人工智能等前沿技术的发展,具身智能赛道逐渐火热,超百家企业入局,其中,一家2023年创立的公司非常令人意外地脱颖而出,两年时间融资规模超14亿元人民币,成为超越98%企业的独角兽。
这家初创公司,名为【星海图】。
▍星海图的创始团队
星海图能够如此获得市场关注,得到资本市场的青睐,这离不开它的创始团队。
星海图创始团队由高继扬、赵行、许华哲和李天威四位成员组成。其中,高继扬负责统筹,赵行和许华哲负责具身智能,李天威负责机器人整体。四位成员各司其职,组成“银河战舰”级别的具身智能团队。
高继扬作为星海图CEO,拥有清华大学电子工程学士学位,并在美国南加州大学以3.5年时间取得计算机视觉博士学位,曾任Waymo高级工程师和技术负责人、Momenta执行总监。
高继扬创业的梦想自大学时期便生根发芽,而确定创业方向则是在大四下学期的商汤科技实习中确定下来的,那是高继扬第一次接触到人工智能,同时人工智能也成为高继扬留学深造的攻读方向。
来到USC(南加州大学)后,高继扬进入到IRIS计算机视觉实验室,选择计算机科学系计算机视觉领域的研究专家Ram Nevatia作为导师。在留学生活中,高继扬为加速创业进程,在计算机视觉研究上加倍努力,用了不到四年时间就毕了业,高于他自己设定的目标。
毕业之后,高继扬并未着急创立自己公司,而是选择积累工作经验,他看好当时火爆的自动驾驶行业,认为其不仅与AI关系密切,更昭示了一个更广阔的未来——具身智能。于是,高继扬进入了如日中天的Waymo做感知方面的工作。
在Waymo工作期间,高继扬表现出高度的自驱力,他既能高效开发产品,又能主动推进研究,可以说是一人担两职,为其创业打下了坚实的基础,积累了丰富的工程经验。
也是在Waymo,高继扬结识了赵行。
赵行是MIT计算机视觉博士,后在Waymo担任研究员。2020年回国加入清华交叉信息学院。
赵行来到MIT后,目标并不算明确,因此他在读博期间涉猎多种研究方向,以此来探索自己的兴趣所在。
在MIT的头两年,赵行师从Ramesh Raskar研究计算成像,在研究过程中,他逐渐意识到计算成像与自己的理想相左,他想做些能够对现实世界有重要作用的工作,比如能够提高生产力等等。
于是,赵行开始了自己在MIT的摸索之旅。
在决定不做计算成像后,赵行先选择了机器人方向。他加入到 MIT Cheetah系列四足机器人项目中,负责Cheetah2项目的感知系统搭建工作。在项目期间,赵行曾向Sangbae Kim教授力推深度学习,但当时深度学习在控制领域效果表现并不出色,没有得到控制派学者的认可。
后一年,赵行接触到自动驾驶,转向John Leonard教授发起的Duckietown项目,该项目负责开发自动驾驶的研究和教学平台,希望构建一个多智能体的自动驾驶交通系统。赵行作为助教,负责整个平台的搭建,还参与了深度学习感知模块。
再后来,赵行开始研究多模态学习,并取得了不小的成果。在Antonio Torralba教授的课题组中,赵行提出了视觉-声音跨模态学习方法 Sound of Pixels,解决了语音领域长久以来的“鸡尾酒问题”,还和隔壁组的赵明民(现 UPenn 助理教授)合作提出视觉-WiFi 跨模态学习方法 RF-Pose,用WiFi实现人体姿态识别。
毕业时,赵行凭借自己擅长的视觉与多模态学习,明确了自己的求职目标,认为其研究对自动驾驶与机器人很有价值,而当时机器人行业尚未成形,因此赵行选择了自动驾驶行业,并如愿以偿进入到Waymo。
在Waymo工作期间,赵行主要负责两个方向。一个是多模态感知,涉及视觉、激光雷达、毫米波雷达和声音等多传感器数据融合;另一个则是学习驱动的预测规划,主要建模车辆与环境的交互。
在Waymo工作一年多后,随着深度学习的发展,赵行意识到深度学习正使各领域边界持续消融,因此他不希望局限于单一研究方向,选择回国加入清华任教,创立MARS实验室,来做更广泛的AI研究。
在清华任教期间,赵行得以与许华哲结识。
许华哲在伯克利获得博士学位,后在斯坦福博士后,是清华“Embodied AI(具身智能)”实验室负责人。
许华哲来到伯克利大学后,加入了Trevor Darrell的课题组。团队主攻域迁移与视觉-语言两大方向,但Trevor更鼓励学生自由探索、广开思路,因此许华哲在导师的建议下反而去研究自动驾驶课题。
经过几个项目的研究后,许华哲逐渐摸清自己的兴趣,希望创造出能做决策、与世界互动并对世界产生影响的智能体。在与Sergey Levine合作后,许华哲的研究重点从单纯的视觉转向了强化学习、视觉与机器人结合的方向。
在与Sergey合作过程中,许华哲虽未接触到真正的机器人,但很好地培养起了自己的研究兴趣。后来随着机器人成本逐渐下降,许华哲开始逐渐上手真机,真正转向了具身智能。
在斯坦福拿到清华叉院的offer后,许华哲决定回国研究具身智能,但彼时具身智能的概念在国内还未兴起,许华哲为展开研究成立了自己的实验室。
时间来到2023年,高继扬、赵行、许华哲三个人相遇。彼时具身智能领域的创业时机已成熟,高继扬先是找到曾经的搭档赵行聊起创业事宜,两人可谓是一拍即合。恰好此时许华哲早已酝酿创业的想法,听闻赵行的创业计划,经过“促膝长谈”,发现三个人想法高度契合,许华哲便顺理成章加入这个创业团队。
如前所说,此时这个团队高继扬负责全盘规划,赵行长于视觉感知和导航技术、许华哲擅长具身智能操作,二人联合便能够应对具身智能的核心模块,但机器人本体研发却缺少空缺,即使高继扬再全能,也是分身乏术。就在这时,高继扬想起了李天威。
高继扬在Waymo工作一段时间后,积累起了工程经验,并受到了比较全面的技术能力训练和学习,工程素养较为完备,但以创业为理想的高继扬在Waymo却无法得到带领团队做产品交付与企业如何运转的经验,同时他发现Robotaxi商业模式和Waymo存在的一些问题,于是便决定回国,加入Momenta做量产工作,希望能够培养自身的产品量产和管理能力。
李天威,就是高继扬在Momenta结识的同事。
李天威是UCL硕士,校招进入Momenta后,仅用了五年,便升职了4次,成为高级总监。高继扬通过与李天威合作,了解他的能力与人品,在合作过程中也积累起了默契与信任。因此,李天威也加入到了星海图的创始团队中,负责机器人本体和系统研发。
▍星海图的发展
至此,高继扬、赵行、许华哲和李天威四人聚首,可以说组成了一个宛若“银河战舰”般强大的初创团队。四人于2023年9月正式创立星海图,专注于具身智能基础模型及具身智能机器人研发。
身为一家初创公司,星海图已完成多轮融资。据悉,星海图近日更是接连完成A4及A5轮战略融资,两轮合计融资金额超过1亿美元(约合人民币7.1亿元)。
其中,A4轮融资由今日资本、美团龙珠联合领投,中金保时捷基金、襄禾资本,以及老股东米哈游、无锡创投集团跟投。
A5轮由美团龙珠、美团战投联合领投,北京机器人基金超额加注,亦庄国投跟投,IDG资本、BV百度风投、凯辉基金、今日资本、襄禾资本等老股东持续追投。
截至目前,星海图的融资规模已超14亿元人民币。
值得注意的是,此前星海图已完成多次A轮融资,而将A轮融资拆分成多次,据内部人士介绍,具身智能产业目前还未进入爆发期,将这一时期的融资以同一阶段命名,是基于行业及企业发展阶段的判断。
据悉,本轮融资将重点用于加强“整机+智能”全栈自研能力:在持续突破VLA端到端模型能力上限的同时,生产规模、关节模组研发等硬件能力也将同步提升。
目前,星海图已取得多项技术成果。
软件方面,星海图致力于具身大模型的研发,已推出了围绕具身智能的“快-慢”双系统模型架构——EFM-1(Embodied Foundation Model-1)。
据了解,该模型融合了“慢思考”的数百亿参数视觉语言大模型(VLM),与“快执行”的数十亿参数动作大模型(VLA),实现从感知理解到控制的闭环决策。未来,EFM 系列模型及数据或将逐步面向开发者开源。
硬件方面,星海图已研发出三款通用机器人,包括仿人形机器人星海图R1、星海图R1 Pro,以及数据采集全身移动操作平台星海图R1 Lite。
据悉,星海图R1已被李飞飞团队应用于WB-VIMA模型的数据采集工作中,而星海图R1 Lite则被Physical Intelligence应用于π0.5模型的数据采集。
星海图在软硬件协同发力,以“整机+智能”为战略支点,以“标准硬件+标准数据+标准工具”为核心,争取为全球开发者提供可落地、可扩展、可评测的具身智能基础设施,以此来助力具身智能产业的发展,加速行业构建“本体—数据—模型—应用”的闭环。
▍结语与未来
高继扬、赵行、许华哲和李天威四人看到具身智能的发展前景,各自的想法虽有不同,但最终高度重合在一起,共同组成星海图的初创团队。
在不到两年的时间里,星海图专注技术研发,招贤纳士,并取得了不小的成果,在具身智能赛道上展现出巨大的成长潜力,得到了资本市场的关注。
星海图坚持AI算法与本体协同发展的思路,从技术的边界和场景的需求出发定义本体形态,自主设计并制造本体,实现从核心模组、具身本体、数据、端到端基础模型及场景解决方案全栈自研。
此次星海图再获超七亿元融资,证明了资本市场对其核心技术能力、商业化路径与未来潜力的高度认可。
未来,星海图凭借团队、技术等优势,在资本市场的押注下,或将站在具身智能浪潮的前列,最终实现让具身智能体服务世界的愿景。
(更多人形机器人赛道深度文章,请关注微信公众号“人形机器人发布”)