千寻智能Spirit v1.6反超英伟达Cosmos 3,靠真实数据闭环3个月融资近50亿!
千寻智能Spirit v1.6反超英伟达Cosmos 3
6月1日,老黄在GTC上花不少篇幅讲物理AI和具身智能,发布Cosmos 3。英伟达称其为面向Physical AI的最新前沿、全球首个完全开放的全能模型,有视觉推理等能力,老黄自豪表示它在全球各大排行榜开放模型中排第一。但仅一天后,RoboArena榜单更新,千寻智能的Spirit v1.6反超,登上全球第一。
RoboArena评测机制及意义
RoboArena切中机器人基础模型评测核心问题,很多模型在仿真环境表现好,在真实场景难稳定复现。它可理解为LMArena的具身机器人版本,比的是机器人策略在真实世界完成任务的能力。由UC Berkeley、Stanford、NVIDIA等发起,相关论文入选CoRL 2025 Oral。其机制有分布式协作、双盲对决、Elo式动态排名、开放评测网络,意义是把具身智能评测从「静态跑分」推向「真机对抗」。千寻智能成首个在该「客场」榜单获全球第一的中国企业,表明其多任务执行等能力进入全球第一梯队。
Spirit v1.6真实任务表现及迭代机制
从双盲对比视频看,第一组打开笔记本任务,Spirit v1.6动作衔接自然,快速完成任务,Cosmos 3几乎无有效尝试;第二组把卡皮巴拉放到盘子里任务,Spirit v1.6完成识别等操作,虽有短暂调整但整体连贯,pi 0.5既未识别目标也未有效抓取。今年稍早,Spirit v1.5在RoboChallenge真机评测获第一,有不错稳定性。从v1.5到v1.6,千寻智能靠持续采集真实场景数据、关注失败点、反馈评测结果到训练和优化的迭代机制,在RoboArena完成反超。具身智能模型不同于纯软件模型,Spirit v1.6表现说明千寻智能运转起数据闭环。
真实世界数据是胜负关键
在GTC上,黄仁勋强调物理AI数据难获取,因互联网视频多为第三人称视角,机器人需要第一人称、可行动、可反馈的数据。Cosmos 3目标之一是缓解数据稀缺问题,大厂认为模型能力提升依赖构建贴近机器人行动的数据体系。千寻智能更注重真实世界数据沉淀,已自研7代数采设备,在全国100多城市搭建网络,计划2026年沉淀百万小时级数据。其「数据金字塔」底层是大规模真实世界交互数据,来源多样;中间层是数据工程能力,失败数据更有价值;上层是模型能力和任务泛化,数据规模提升或让任务成功率更稳定。Spirit v1.6成绩验证真实世界数据是具身智能公司关键竞争变量。
资本押注千寻智能原因
千寻智能3个月完成四轮融资近50亿,本轮15亿A+轮资金将用于模型迭代、数据基础设施建设和商业落地。融资节奏不常见,资本关注其是否形成可持续飞轮:真实场景产生数据,提升模型能力,支撑更多场景落地,再产生数据。融资本身不证明技术领先,资金用途通常是扩大模型设施、建设数据体系、推进场景部署,千寻智能优势集中在这三方面,且将商业化作为数据和模型迭代一部分。它与博世合作验证工业场景执行能力,与京东合作让Moz机器人进门店服务,小墨机器人落地宁德时代产线,工作量达人工3倍。不同场景推动模型补齐能力,形成商业化「黄金三角」。
具身智能竞争走向
具身智能竞争从单点模型能力走向系统能力比拼,各环节共同构成物理AI落地基础。千寻智能连续表现说明具身智能进入更接近真实应用的验证阶段,谁能建立数据闭环、转化场景反馈,谁就能在竞争中占主动。物理AI故事才开始,千寻智能正走通关键之路。
