当人形机器人的融资消息还在密集刷屏时,一批押注更上游位置的具身智能企业正在悄悄完成融资。苏州核数聚信息科技有限公司近日宣布完成数千万元A轮融资,由善达投资领投,吴中金控、融玥投资跟投。这笔钱不打算用来做机器人,而是用来做机器人训练所需的数据基础设施。

这个赛道此前鲜少出现在大众视野中,但它正在成为具身智能产业链里最值得关注的环节之一。
PART 01
热钱涌向机器人,但数据问题还没人解决
过去两年,具身智能赛道的融资密度和估值水位持续走高。宇树、傅利叶、智元、乐聚等一批本土机器人企业相继完成大额融资,特斯拉Optimus的量产预期也在持续推高市场情绪。

但喧嚣背后,一个基础性问题始终没有被正面解决:这些机器人用什么数据训练?
这不是一个可以绕过的问题。与大语言模型可以抓取互联网数据不同,具身智能模型所需的数据必须来自物理世界的真实交互——机器人如何感知空间、响应力反馈、完成精细操作,这些能力的形成需要大量高质量的多模态数据支撑,包括视觉、触觉、力觉、语音等维度的同步采集与对齐。这类数据采集成本极高,且目前行业内各家企业采用的技术路线——遥操作、UMI、Ego视角、仿真合成——彼此割裂,数据格式与质量标准无法互通,更遑论统一评估。

换言之,机器人企业做模型迭代时,面临的不只是算法问题,而是“没有足够好的燃料”。这是当前具身智能从实验室走向规模化量产最真实的阻力。
核数聚押注的,正是这个卡点。
PART 02
数据服务商的转型时机
核数聚并非凭空出现。公司此前长期从事AI数据服务,积累了语音、NLP等方向的数据处理能力与规模化作业经验。这类企业在大模型时代上半场通常处于产业链底层,毛利有限,话语权不高。但具身智能数据的特殊性,给了它们一次重新定位的机会。

传统AI数据标注是劳动密集型工作,人工成本占比高,壁垒不深。但具身智能数据不同:它需要专业传感器阵列与标准化采集硬件,需要处理关节轨迹、三维点云等复杂数据类型,需要在真实场景与仿真环境之间建立可复现的对齐机制。这对数据服务商的技术能力要求远高于传统标注业务,进入门槛的提升客观上有利于先发者。

核数聚目前的做法是在苏州、青岛、芜湖、慈溪等地建设专业化具身智能训练场,同时自研AI预处理引擎,构建“AI预标注+人机协同校验+自动化质检”的处理流程。公司称相较传统模式,数据处理效率可提升3至5倍,准确率达99%。虽然这组数字目前尚无第三方验证,但从客户结构来看,宇树、傅利叶、乐聚、智元、鹿明科技等头部机器人企业已与其合作,在手订单据称已达数亿元规模,这在一定程度上说明其服务能力经过了市场的初步验证。
PART 03
平台化是目标,但挑战也在这里
从这轮融资的用途来看,核数聚的目标不止于做一家数据外包公司,而是要建成一套具有平台属性的数据基础设施——打通采集、处理、训练适配、评估全链路,并通过统一的数据标准与评估框架,解决不同来源、不同模态数据难以对齐的行业痛点。

这个方向在逻辑上是成立的。如果具身智能行业最终走向规模化,一定需要类似“数据中台”的基础设施层,而先期积累了多场景数据集、建立了客户信任与处理能力的企业,将获得更强的竞争位置。核数聚“四足具身智能机器人巡检数据集”入选2026年江苏省数据知识产权登记运用典型案例,也说明其在数据资产标准化方面走在了相对靠前的位置。
但平台化转型也意味着更重的资本投入与更长的回报周期。当前具身智能行业整体仍处于早期,机器人企业自身的量产节奏还存在较大不确定性,下游客户的数据需求能否形成稳定、可预期的规模订单,仍是悬而未决的变量。此外,随着具身智能赛道持续升温,大型科技公司、专业机器人厂商以及更多创业团队入局数据侧的可能性不能排除。核数聚的窗口期究竟有多长,很大程度上取决于行业数据标准化进程的快慢。
PART 04
投资机构在赌什么?
从投资方来看,善达投资、吴中金控、融玥投资均非一线头部机构,但这并不妨碍这笔投资本身的逻辑清晰度。
押注具身智能数据基础设施,本质上是一种“卖铲子”逻辑的变体,不赌哪家机器人公司最终跑出来,而是赌整个行业需要更好的数据供给体系。相比押注单一终端产品,这种底层逻辑理论上有更强的穿越周期能力,但前提是这家企业能在行业格局收敛之前,积累足够深的数据资产与平台壁垒。
目前来看,核数聚完成A轮融资是一个起点,而非终点。具身智能数据赛道的真正爆发,可能还需要等待机器人量产节奏的进一步提速。这家苏州公司的选择,是提前站到那个临界点之前的正确位置上,然后等待。
这个判断能不能兑现,时间会给出答案。