当前位置: 首页 > news >正文

斯坦福评测第一!北大 EvoPhys-World世界模型在摩尔线程GPU完成原生训练

近日,北京大学 EvoPhys 团队推出以“人”为中心、面向“场景级万物可控”的 5D 世界模型 EvoPhys-World。据斯坦福大学 WorldScore 公开评测榜单,截至发稿时,EvoPhys-World 在世界生成(World Generation)评测中位列第一。这一国际前沿成果全程在摩尔线程 MTT S5000 全功能 GPU 上完成原生训练,并由 MUSA 软件栈提供全栈支撑。

WorldScore实时榜单:EvoPhys-World 位列第一

排名公示链接:https://huggingface.co/spaces/Howieeeee/WorldScore_Leaderboard

从像素到物理,从“看见世界”到“撬动世界”,世界模型正在重塑 AI 理解物理世界、迈向具身智能的根本范式;在通用人工智能的版图中,它已成为检验算法创新与算力能力的试金石。EvoPhys 团队的此次突破,正是中国科研力量在这一前沿方向上的有力探索。

模型能力与技术细节详见项目主页:EvoPhys-World

世界模型:AI走进物理世界的“试金石”

过去一年,AI 正从数字世界加速走进物理世界,而能否真正“理解并撬动世界”,是这一进程绕不开的命题。一系列公开工作已能构建连续、逼真的虚拟世界,但“可操控、可交互”仍是行业的开放课题——生成的世界大多更擅长“看”,而较少能真正“动”。

EvoPhys-World 的特殊之处,正在于把 AI 生成的世界从“可观看、可漫游、浅交互”,推进到“可操控、深交互、自进化”:它以“人”为中心,将第一视角下的人类观察与手部交互作为通用动作表征,从大规模原始无标注人手 EGO 数据中学习;并以World Engine(万物可孪生、物理可交互)World Policy(世界可预演、万物可操控)两种形态,构成从“生成世界”到“操控世界”的完整闭环。

EvoPhys-World 模型架构图

这一前沿探索的国际能见度,也得到了第三方公开评测的印证:在斯坦福大学提出、发表于 ICCV 2025 的世界生成统一评测基准 WorldScore 上,截至本文发布时,EvoPhys-World位列世界生成评测第一。

国产算力护航:MTT S5000 全功能 GPU 与 MUSA 软件栈全程支撑前沿世界模型训练

世界模型是对算力与软件栈的双重考验。面向约 4 万小时纯人手 EGO 数据,EvoPhys-World 需要在长时序第一视角交互数据中,同时建模时空记忆、状态预测、动作预测、物理交互与策略演化,对训练稳定性、数据吞吐与软硬件协同效率提出了很高要求。

作为摩尔线程旗舰级 AI 训推一体全功能 GPU 智算卡,MTT S5000专为大模型训练与推理设计;依托MUSA 软件栈的高兼容性与开放架构,摩尔线程为 EvoPhys 团队训练 EvoPhys-World 这类新型世界模型提供了全栈支撑:

全功能 GPU 算力底座:MTT S5000 面向大模型训练与推理负载,结合架构层面的计算单元协同与原生 FP8 等多精度训练能力,为前沿模型训练提供底座算力。

MUSA 软件栈全方位支持:从分布式训练框架、丰富的算子支持,到高效的卡间通信与软硬件协同优化,MUSA 软件栈支撑了这一以扩散式生成为核心、融合多模态时空建模的新型世界模型,从适配到稳定训练的全链路落地。

大规模稳定扩展:依托高效的卡间通信与并行策略,MTT S5000 集群在长时序、高负载的世界模型训练中保持稳定运行与大规模扩展能力。

这意味着,国产全功能 GPU 不仅能“跑得起来”前沿世界模型,更能在软硬件深度协同下,支撑其从研发探索走向规模化训练。

软硬协同的训练成绩单

EvoPhys-World全程在 MTT S5000 上原生训练在训练负载的实验室验证中,MTT S5000 交出了一份兼顾扩展性、对齐性与生成质量的成绩单:

大规模近线性扩展:训练吞吐在从单机到 20 节点规模的扩展中保持近线性增长,多机区间弱扩展效率保持在约 90% 水平,验证了国产算力平台在大规模世界模型训练上的可扩展性。

图1:MTT S5000 多机弱扩展效率(以16卡为基准):从单机到20节点(160卡),训练吞吐保持近线性扩展,弱扩展效率约90%。数据来自北京大学EvoPhys团队实测。

与国际主流 GPU 性能接近:在对齐验证条件下,MTT S5000 与国际主流产品的训练吞吐基本持平、多机扩展效率曲线趋势接近。

图2:对齐验证条件下,MTT S5000与国际主流产品的多机扩展效率曲线趋势接近。数据来自北京大学EvoPhys团队实测。

表1:对齐验证条件下相对训练吞吐(以国际主流产品为100%):MTT S5000与国际主流产品基本持平。数据来自北京大学EvoPhys团队实测。

生成质量定性一致:在相同初始帧、相同 prompt 的推理设置下,基于国产算力训练所得模型与基于国际主流产品训练所得模型,生成的第一视角人手操作视频在抓握姿态、书写笔迹、手—物接触与物理反馈上定性一致,无明显结构崩坏或时序断裂。

图3:同prompt推理生成对比——左为基于国产算力训练所得模型,右为基于国际主流产品训练所得模型。Demo来自北京大学EvoPhys团队实测。

全链路闭环:让前沿世界模型在国产算力上自主生长

一次成功的前沿模型训练,背后是一条完整的自主链路。摩尔线程与北京大学的此次协同,推动了“前沿模型 — 本土软件栈(MUSA)— 国产算力(MTT S5000)— 开发者与产业工作流”的全链路闭环。

对国内高校、科研机构与具身智能团队而言,这条闭环意味着在算力可得性、软硬件自主性与长期迭代能力上拥有更高的自主权,从而加速从前沿探索到产业落地的全流程。国产算力的命题,正在从“能不能训练模型”,走向“能不能训出在国际前沿评测中位居前列的模型、并让这套能力自主、可控地持续生长”——这也是国产软硬件生态从“可用”迈向“好用”与“领先”的关键一跃。

摩尔线程“灯塔计划“全力支持中国科学家做出世界领先的原创成果

EvoPhys-World 的此次突破,也是摩尔线程“灯塔计划”支持下的一项标杆成果。“灯塔计划”是摩尔线程面向全球科研机构推出的算力支持与协作计划,为具有创新性、前沿性的科研项目提供优惠算力以及工程、生态资源,助力科学家突破资源瓶颈、聚焦核心问题、加速原创突破。摩尔线程希望以国产芯片与国产软件栈为底座,支持中国科学家做出世界领先的原创成果——本次与北京大学 EvoPhys 团队的协同,正是“灯塔计划”的一次生动实践。

结语:从“看见世界”到“改变世界”

物理世界的数字镜像,正在被逐层理解、逐步“撬动”。世界模型的竞争,正从“谁生成得更逼真”,走向“谁更懂物理、谁更会交互、谁能自我进化”;而支撑这场竞争的算力底座由谁来筑、能否自主可控,同样是一道必答题。

在 AI 走进物理世界的时代浪潮中,摩尔线程愿与高校、科研机构及广大开发者一道,以全功能 GPU 与 MUSA 软件栈为坚实底座,并通过“灯塔计划”持续为前沿科研提供算力与工程支持,在从“看见世界”到“改变世界”的未竟之路上,助力更多科学家突破核心技术、推动产业高质量发展。

http://www.jsqmd.com/news/978721/

相关文章:

  • 别再到处找破解版了!用这个免费在线工具draw.io,5分钟画出高颜值技术架构图
  • 保姆级教程:用Simulink搭建三相异步电机SPWM变频调速模型(从整流到逆变全流程)
  • UVM实战避坑:当你的transaction太‘个性’时,为什么uvm_do_on_with会拖后腿?
  • 图片去水印用什么工具?2026免费图片去水印工具推荐
  • 别再只学攻击了!用Kali Linux的arpspoof工具,手把手教你搭建ARP欺骗防御测试环境
  • 7.5元包邮的RC522读卡器,手把手教你用Arduino复制小区门禁卡(附完整代码)
  • 2026年口碑好的南通二手房家装改造公司/南通本地家装设计公司业主好评榜 - 品牌宣传支持者
  • aixingpan.cn API开发文档:api_docs_authentication接口指南
  • 告别迷茫:用C++从零手搓一个Echo Server(附完整代码与nc测试)
  • 别再死记硬背公式了!用Python+NumPy手把手模拟MIMO信道,直观理解空分复用
  • 别再手动下拉了!Excel高手教你用Ctrl+Enter一键搞定上万行时间差计算
  • C语言内存管理说明,存储方式
  • EoM:用哈耶克的市场经济理论开发智能体,效果惊人
  • 都2026年了!想入行网络安全却不知道从哪开始?
  • 在Windows 11上用WSL2搭建OpenHarmony开发环境:从Ubuntu 20.04配置到RK3568编译一条龙
  • MATLAB实现月球着陆燃料最省轨迹规划:含动力学建模与非线性优化求解
  • Leetcode31 下一个排列
  • 告别连接失败:解决RT-Thread下LWIP的sockets与netconn差异问题
  • Spring AI 1.x 系列【43】基于标准输入输出 (STDIO) 与服务端推送事件 (SSE) 的 MCP 服务端
  • 从一次信息泄露事件说起:我是如何用Have I Been Pwned和Reg007保护自己账号的
  • COMSOL仿真避坑指南:搞定自然对流,这些边界条件和求解器设置千万别踩雷
  • ESP32-S2驱动EC11编码器,我踩过的三个坑和最终解决方案(附完整代码)
  • 高光谱图像修复技术:HSI-VAR架构与实战应用
  • Redis分布式锁进阶第三十二篇
  • 告别手动标注!用飞桨EasyDL的‘魔术笔’10分钟搞定4000张语义分割图
  • STM32课程设计避坑指南:从篮球记分器项目看红外遥控与定时器的实战应用
  • STM32F103R6频率计实战工程:Keil编译+Proteus仿真一键运行
  • 保姆级教程:手把手教你搞定华为USG6000V防火墙的跨版本升级(含固件下载与密码重置)
  • 手机App控制51单片机LED?一个HC-06蓝牙模块+串口中断就能搞定(附完整代码)
  • Proteus 8.6 仿真超声波测距,我踩过的坑和调试技巧(附完整工程)