当前位置: 首页 > news >正文

CVPR‘26 Highlight | ParticleGS:首个物理驱动4DGS预测新范式,通向4D世界模型!

点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

作者投稿授权发布 | 来源:3D视觉工坊

「3D视觉从入门到精通」知识星球(点开有惊喜) !星球内有20多门3D视觉系统课程、3DGS独家系列视频教程、顶会论文最新解读、海量3D视觉行业源码、项目承接、求职招聘等。想要入门3D视觉、做项目、搞科研,欢迎加入!

在探索4D世界模型的道路上,关键的一步在于不仅能复刻观测到的三维世界,更能推演未知的动态未来。

然而,当前的动态3D重建技术,如动态3DGS和NeRF,却存在一个关键不足:它们极度擅长“插值”回忆过去,却在“外推”预测未来时束手无策。当观测时间一旦停止,画面中的物体往往会发生违背物理常识的扭曲与崩坏。

收录会议:CVPR 2026 Highlight
论文链接:https://arxiv.org/pdf/2505.20270
Github链接:https://github.com/QuanJinSheng/ParticleGS

图1 ParticleGS能够学习潜在的物理动力学,从而以物理一致的运动和外观外推未来的高斯点云;相比之下,现有的时间条件方法则无法预测出合理的运动。

为了打破这一僵局,由浙江大学联合多所高校推出的最新研究成果ParticleGS给出了一种新的建模思路:抛弃对轨迹的死记硬背,让神经网络学习底层的神经物理规律。该框架实现了在无需人工设定繁琐的先验假设或几何网格的情况下,直接从RGB视频中学习3D高斯粒子的神经动力学,实现了极其稳定、符合物理直觉的未来运动外推。该成果凭借其基于物理的建模与4D预测上的突破,被CVPR 2026接收为 Highlight论文。

研究动机:为什么现有4D重建方法难以预测物理真实的未来?

怎样的4D生成与重建才算得上“世界模型”?关键在于对“时间”的理解。

现有的时间条件模型通常将物体的变形直接建模为时间的函数。这种“轨迹拟合”式的方法虽然在观测时间内表现优异,却因缺乏对底层物理规律的理解,在预测未来(运动外推)时极易出现物理上不合理的崩坏。由于缺乏底层的物理上下文,模型预测的轨迹就会严重偏离真实的物理规律。另一些尝试引入物理先验的方法(如注入纳维-斯托克斯方程),要么极度依赖人工设定的外部力场和严苛的假设条件,导致泛化能力极差;要么只能处理低阶的运动学信息,难以驾驭复杂的高阶变形。

核心洞察:现实世界中的运动往往是受高阶微分方程dx/dt=f(x,t)支配的,我们为何不把动态3D高斯场景直接重构为一个基于物理微分方程支配的粒子系统?与其让模型记住轨迹,不如让模型学习产生轨迹的动力学规律并在未来预测时遵循它,从而能推演出未来的轨迹。

图2 二维阻尼螺旋线上的玩具实验。(a)基准模型能很好地拟合训练数据,但在外推阶段表现不佳;(b) Neural ODE建模底层微分方程,捕捉到了螺旋动力学特征,即使在未观测区域也能保持正确的运动轨迹。

架构重构:ParticleGS的基于物理的建模范式

从“拟合时间”到“推演物理”,ParticleGS 提出了一套优雅的“编码器-演化器-解码器”框架,攻克了从纯视觉中学习物理运动规律的难题:

图3 ParticleGS框架概述。(a)现有方法:现有方法为每个独立的离散时间点分别学习形变模型。(b)ParticleGS:一个基于物理规律的框架,利用隐式物理状态来驱动3D高斯形变,从而实现运动外推。(c)动力学潜在空间编码器:负责为高斯点编码物理状态,并将其分解为静态属性与动态场。(d)Neural ODE演化器:通过对动态场在连续时间内的演化进行建模,从而学习底层的物理规律。

1.动力学隐空间编码器:对于包含数百万个 3D 高斯点的场景,如果独立演化每个点的物理状态,计算量将是一场灾难。研究团队从物质点法(MPM)中汲取灵感,将N个高斯粒子的物理状态巧妙地解耦为两部分:每个粒子的时间不变的“静态属性”(如质量、材质)以及全局粒子共享的F个“系统级动态场”(如引力场、风场)。这使得后续的时间演化时仅仅需要更新紧凑的F个动态场向量,从而计算复杂度从庞大的O(NG)降低为O(FG),其中F≪N。实现了表示能力与计算效率的平衡。

图4 物理状态可视化。运动相似的高斯表现出相近的特征,并且随时间变化稳定。

2.基于神经常微分方程的演化器:为了突破人工嵌入的低阶速度场或特定场景下微分方程的瓶颈,团队引入了神经常微分方程(Neural ODEs)。由于任何高阶微分方程都可以等价地转化为增广状态空间下的一阶系统,该演化器能够以连续时间马尔可夫状态转移的形式,学习复杂的高阶物理动力学。简而言之:它不仅知道物体这一秒的速度,还理解了加速度和更深层的受力变化。

3.高斯核空间解码器:在将物理状态还原为视觉画面时,解码器采用Rodrigues旋转公式,将粒子的运动严格分解为平移和旋转变形。这种物理意义明确的解码过程,确保了最终渲染出的3D高斯变形在视觉上自然、符合刚体或柔性体的物理常识。

实验结果与分析

数值实验表明,ParticleGS 在多个数据集上的未来高斯外推中取得了最佳性能,并与现有的SOTA重建方法取得了相当的渲染质量:

外推预测精度: 相比于HexPlane、DeformGS 等时间条件模型,以及注入了物理先验的模型(如NVFi),ParticleGS在未来预测任务上,在合成数据集上实现了超过5 dB PSNR的提升。即便面对基于速度场的方法(TRACE和FreeGave),ParticleGS依然在合成数据集上保持了近 2.5 dB的PSNR优势,并在真实世界的GoPro数据集中保持了性能优势。

重建任务精度:虽然ParticleGS的最大亮点在于其前所未有的运动外推能力,但这绝不是以牺牲基础重建质量为代价的。在动态3D重建任务中,ParticleGS均取得了与现有重建方法更好或相当的表现。

图5 未来时间下新视角的定性对比实验。ParticleGS的预测的运动更准确,模糊与伪影更少。

总结与展望:对4D物理世界模型的探索

ParticleGS探索了一条通往4D世界模型的新路径:我们完全可以绕开繁琐的手工物理公式输入和几何预处理,仅凭一段视频,就让模型在其隐空间中自己学习物理定律。这种将3D表征与连续系统动力学融合的思路,赋予了模型理解并推演物理世界的能力。

本文仅做学术分享,如有侵权,请联系删文。

3D视觉方向论文辅导来啦!可辅导SCI期刊、CCF会议、本硕博毕设、核心期刊等。

添加微信:cv3d001,备注:姓名+方向+单位,邀请入群。

http://www.jsqmd.com/news/769628/

相关文章:

  • 探索radare2技术栈:核心依赖库与第三方组件全解析
  • 保姆级教程:基于RK3588S的8K视频播放器实战(从硬件选型到FFmpeg编译)
  • 护发精油推荐:护发精油功效与品牌综合推荐 - 速递信息
  • osquery数据归档完整指南:高效存储与快速检索的终极方案
  • 如何掌握C语言树结构:二叉搜索树与AVL树平衡技术完整指南
  • 2026温州GEO优化趋势:源头工厂如何截流出海 - 资讯焦点
  • NoFences:用5个分区彻底解决Windows桌面杂乱问题
  • 基于AI与自由标签的智能错题管理系统设计与实践
  • 告别漫长等待:利用国内镜像和离线包,在Win11上快速部署TeX Live 2023 + TeXstudio
  • LSLib终极指南:神界原罪与博德之门3 MOD开发的5个核心技巧
  • 基于Rust的高性能TCP/UDP代理cc-proxy-rs部署与架构解析
  • 2026年怕AI检测卡论文?必备3招高效降低AI率,附权威平台亲测对比 - 降AI实验室
  • 如何快速打造个性化机械键盘:Cherry MX键帽3D模型完全指南
  • 苏州上门回收实测:福正美97分钟达,第二名的数据不好意思写 - 福正美黄金回收
  • 高效音频解码:Silk v3解码器完整解决方案
  • mubeng 多平台部署指南:Docker容器化与系统服务配置
  • TlbbGmTool实战手册:高效管理《天龙八部》单机版游戏数据
  • 卡券变现选京大大,安全又省心 - 资讯焦点
  • 终极指南:如何免费解锁原神60帧限制,实现144Hz高刷新率体验
  • 从空气能源热泵机组看2026年四川热能设备行业趋势 - 深度智识库
  • 如何快速掌握数据科学模式识别技术:从零到精通的完整学习指南
  • 3种方法自定义GBT7714会议论文格式:告别双斜杠的烦恼
  • 北京市 SCMP 报考官方授权机构及相关指南 - 众智商学院课程中心
  • 从寄存器位到全球市场:一文读懂RDA5807频段配置,让你的杰理AC696X方案卖遍全球
  • MHY_Scanner:终极米哈游游戏登录助手,一键解决扫码登录难题
  • 如何用胡桃工具箱提升你的原神游戏体验:免费开源工具箱完全指南
  • 基于Cloudflare Workers构建企业级OpenClaw多用户托管平台
  • 珠三角物流专用升降台哪家能实现仓库生产线对接 - 中媒介
  • 2026年曲靖公司代理记账一站式财税服务深度评测 - 年度推荐企业名录
  • 3个关键技术突破:applera1n如何重新定义iOS激活锁绕过