当前位置: 首页 > news >正文

为机器人原生,时空一体世界动作模型问世!复旦系开辟具身AGI最优解

当前,通用人工智能的竞争正从虚拟数字空间全面迈向真实物理世界,具身智能、机器人大脑已然成为 AGI 赛道的核心决胜高地。当前行业主流的 VLA 视觉语言动作模型、通用世界模型、视频推演方案,普遍存在空间感知精度不足、物理逻辑约束缺失、长时序规划能力薄弱、真机落地鲁棒性差等一系列痛点,无法支撑机器人实现真正的自主感知、自主推理、自主决策与稳定交互。

在物理 AI 产业快速迭代的关键节点,深耕世界动作模型底层技术五年的复旦系科创企业眸深智能,正式推出STI-WM 时空一体世界动作模型,Spatiotemporally Integrated World Model。

作为专为机器人原生打造的通用具身大脑,该模型以时空一体化建模、物理一致性约束、端到端原生融合为核心,彻底打破传统模型的技术桎梏,开辟了物理世界 AGI 落地的最优技术路径。

原文链接:为机器人原生,时空一体世界动作模型问世!复旦系开辟具身AGI最优解

01.复旦+英特尔+英伟达,硬核学术成果稳居全球第一梯队

眸深智能的技术突破,源于长期深耕的学术积淀与全栈工程能力。公司核心团队源自复旦大学深度学习实验室,构建了学术科研、工程落地、产业商业化三位一体的顶级团队架构:由复旦大学未来信息创新学院教授、深度学习实验室主任陈涛坐镇科研底层,原英特尔中国首席科学家张益民博士和来自英伟达的技术负责人掌舵工程化落地,95 后复旦连续创业者穆泽林主导商业化布局,形成实力强劲的 “复旦铁三角” 核心阵容。

团队超九成核心研发人员来自复旦大学,汇聚百余名校硕博人才,自 2021 年行业风口未至之时,便前瞻性布局世界模型、三维感知、时序动作生成三大底层核心技术,持续深耕技术攻坚。

多年来,团队斩获多项全球顶尖赛事冠军顶级学术荣誉:推出全球首个人形动作生成大模型 MotionGPT、三维世界模型 HL3DWM;拿下 ICCV2023 全球三维目标识别冠军、CVPR2024 三维密集语义推理冠军,斩获 IJCAI2025 杰出论文奖,是近五年国内唯一斩获该奖项的具身智能团队,团队技术负责人斩获2025年中国具身智能新秀EAI榜单20强。其原创技术成果被英伟达 DAIR 等国际顶尖实验室引用,学术创新与工程落地能力稳居全球第一梯队。

02.重构行业技术范式:5年沉淀,开创并引领世界动作模型路线

当前行业多数方案仍采用通用世界模型 + VLA 拼接的改良模式,模态割裂、信息损耗严重,缺乏真实物理世界约束,只能实现 “视觉合理”,无法适配机器人真机落地的真实需求。

眸深智能从 AGI 本质出发,率先确立世界动作模型原生融合路线:机器人与物理世界的一切交互,最终都落地为动作,唯有精准理解时空演化规律、遵守物理逻辑、实现端到端原生映射,才能真正解决机器人泛化性差、落地难的行业顽疾。

早在 2022 年,团队便创新性提出全球首个影空间语言 - 动作端到端映射 MLD 模型,成果发表于 CVPR 2023,该核心思路在 2025 年 5 月被英伟达 DAIR 实验室核心工作引用验证。历经五年迭代,团队已完成7 代动作模型技术更新,在多模态端到端融合、高精度动作生成、时序逻辑推演领域积累深厚,动作精度、推理速度、任务泛化性持续领跑行业。

03.机器人原生架构四维统一,破解真机落地核心痛点

不同于行业依托大语言模型二次改造的适配性方案,STI-WM 时空一体世界动作模型是完全面向机器人长时序规划、在线闭环控制、真实物理交互打造的原生具身智能框架,实现空间结构、时间演化、物理一致性、执行鲁棒性四维一体化统一。

模型可兼容 RGB 图像、深度点云、机器人本体多模态感知输入,将复杂环境信息统一编码为紧凑高效的时空潜在世界状态,上层支撑百秒级长时程任务推演与全局轨迹规划,下层输出精准可控的精细化动作片段。同时依托实时环境观测动态纠偏、在线重规划,构建出 \“理解世界 — 推演未来 — 规划动作 — 执行纠错”\ 的完整物理智能闭环。

相较于 Dreamer 系列偏重环境预测、忽视真机控制的通用世界模型,LWM、PWM 等时空割裂的抽象动作模型,以及仅追求视觉逼真、无视物理可行性的视频生成模型,STI‑WM 跳出纯视觉推演误区,以三维几何约束、动力学校验、真机闭环执行为核心,彻底解决传统模型信息失真、泛化薄弱、落地困难的核心痛点,让机器人真正做到看懂三维空间、遵守物理规则、自主规划任务、稳定闭环执行。

(眸深STI-WM1.0时空一体世界动作模型架构)

04.六大核心技术壁垒,支撑机器人规模化落地

依托五年全链路自研积淀,STI‑WM 构建起行业难以复刻的技术优势:

  1. 时空一体化原生建模:空间结构与时间动态实时耦合,消除多模块拼接的信息损耗,大幅提升推理效率与决策精准度;

  2. 原生三维感知能力:基于点云直接还原真实物理空间,彻底规避 2D 视觉深度缺失、空间误判的固有缺陷;

  3. 内置物理一致性引擎:融合碰撞检测、动力学约束,从底层杜绝不合理动作与环境崩坏,保障真机执行安全稳定;

  4. 长时程高阶规划:突破传统短片段动作局限,支持百秒级连续复杂任务自主推演,适配真实场景复杂作业需求;

  5. 端侧轻量化部署:自研模型压缩、量化蒸馏技术,实现百亿级大模型低成本落地机器人端侧芯片,大幅降低产业化算力门槛;

  6. 小样本强泛化能力:依托虚拟世界大规模预训练 + 少量真机微调,高效适配陌生场景与长尾任务,大幅降低数据依赖。

05.资本与商业双爆发,产业化进程突飞猛进

凭借底层架构原创创新、全栈自研技术壁垒、可落地的商业化能力,眸深智能迎来高速发展期,半年内完成 5 轮融资,3 亿元 Pre-A 轮融资获 5 倍超额认购,获得国家级投资平台、头部产业资本、券商机构的高度认可。

商业化落地同步驶入快车道,公司已与宇树科技、禾川科技、颐家养老等行业头部企业达成深度合作,技术落地覆盖工业制造、居家康养、商业服务等多元真实场景。目前,眸深智能已与近十家上市公司达成战略合作,其中包含五家以上千亿级产业龙头,未来三年预计可锁定 10 亿元订单支撑,技术产业化速度远超行业平均水平。

(眸深智能与居家养老头部企业颐家战略合作)

当下,AGI 竞争正式进入物理智能新时代,以世界动作模型为核心的原生具身大脑,已然成为通用机器人的核心底座。

未来,眸深智能将持续迭代 STI‑WM 模型体系,全面赋能人形机器人、四足机器人、工业机械臂、服务机器人等全品类硬件,加速通用具身智能的规模化落地,推动中国原生物理 AI 技术领跑全球,开启物理世界 AGI 全新纪元。

重磅!

全网首个!具身智能开源知识库来啦(技术/产业/投融资/上下游)

推荐阅读

真机强化入门的一套完整教程!pi*0.6复现方案

我们用低成本的机械臂完成pi0/pi0.5/GR00T/世界模型等VLA任务~

具身智能的WAM与世界模型一份完整指南~

一览具身智能的行业全局,从产品经理的角度出发!

VLA+RL方向首个系统教程来啦!Online RL/Offline RL/test time RL等~

好用,高性价比!面向具身科研领域打造的轻量级机械臂

VLA/VLA+触觉/VLA+RL/具身世界模型等!具身大脑+小脑算法与实战全栈路线来啦~

从零训练你的足式机器人!让你的足式机器人真正动起来~

1v1 科研论文辅导来啦!

重磅!具身智能之心论文辅导来啦(近20+方向,顶会/顶刊/SCI/EI/中文核心/申博等)

http://www.jsqmd.com/news/985758/

相关文章:

  • 解决jenkins(本机部署或容器部署)安全机制【CSP】问题
  • 2026全球星光荣耀盛典启动 面向全球华人创作者免费征稿
  • SolidWorks_基于草图的实体特征7_筋特征构建
  • LaTeX 绘图单位避坑指南:为什么你的 Draw.io / Matplotlib 导入后字体总是不对?
  • 柳州泰遇尚养生馆:探寻龙城身心灵放松的静谧之所
  • 酒泉市2026年本地上门黄金回收门店指南 彩金+铂金+金条+白银回收门店联系方式推荐 - 干豆腐啊
  • QT初始(1)
  • 2026年效果最好的GEO服务商五强权威盘点:从技术到服务的全景对比 · 第 191 期
  • 芜湖市2026年本地上门黄金回收门店指南 彩金+铂金+金条+白银回收门店联系方式推荐 - 三大殿
  • 从零开始 - 在GitHub创建项目并上传代码
  • 10万QPS下,Redis缓存如何避免雪崩?
  • 海狮企鹅萌宠表演亮点与短板揭秘!动物技能出色,场馆环境待提
  • 多件装组合SKU图的批量生产效率分析:从PS手工到AI自动化的工作流改造
  • 2026武汉网站建设、网站设计、小程序制作公司推荐榜单 - 奔跑123
  • 西双版纳傣族自治州2026年本地上门黄金回收门店指南 彩金+铂金+金条+白银回收门店联系方式推荐 - 三大殿
  • 第1章 认识鸿蒙元服务(零基础入门)
  • 辽源市2026年本地上门黄金回收门店指南 彩金+铂金+金条+白银回收门店联系方式推荐 - 干豆腐啊
  • 2026年6月变频器厂家TOP5综合评测:技术、选型与标杆企业全解析
  • N8N 工作流使用中转API 教程
  • 计算机小程序毕设实战-基于springboot+微信小程序的演唱会售票系统小程序【完整源码+LW+部署说明+演示视频,全bao一条龙等】
  • 微信搜一搜正在成为小程序最大的免费流量入口
  • 阿萨德test
  • 独立开发者最值钱的资产,是 1000 个忠实用户
  • 2026 岳阳厨卫屋面地下室漏水瓷砖空鼓测评:吉修匠 99.8 分五星榜首 - 吉修匠
  • 从0到1:阿里云宝塔面板部署SpringBoot+Vue能源管理系统保姆级教程
  • 116、飞控中的状态机设计模式
  • 2026年上海路面养护洒水车出租公司电话排名:高效降尘/绿化浇灌/工地清洁,专业租赁公司实力解析 - 企业推荐官【官方】
  • 063、NPU的YOLO加速:目标检测网络的硬件优化
  • ROS2 入门教程第一篇:配置 ROS2 环境
  • 襄阳市2026年本地上门黄金回收门店指南 彩金+铂金+金条+白银回收门店联系方式推荐 - 三大殿