当前位置: 首页 > news >正文

SIGGRAPH Asia 2025|30FPS普通相机恢复200FPS细节,4D重建方案来了

点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

来源:机器之心

「3D视觉从入门到精通」知识星球(点开有惊喜) !星球内新增20多门3D视觉系统课程、入门环境配置教程、多场顶会直播、顶会论文最新解读、3D视觉算法源码、求职招聘等。想要入门3D视觉、做项目、搞科研,欢迎扫码加入

本文第一作者陈羽田,香港中文大学 MMLab 博士二年级在读,研究方向为三维重建与生成,导师为薛天帆教授。个人主页:https://yutian10.github.io

当古装剧中的长袍在武林高手凌空翻腾的瞬间扬起 0.01 秒的惊艳弧度,当 VR 玩家想伸手抓住对手 “空中定格” 的剑锋,当 TikTok 爆款视频里一滴牛奶皇冠般的溅落要被 360° 无死角重放 —— 如何用普通的摄像机,把瞬间即逝的高速世界 “冻结” 成可供反复拆解、传送与交互的数字化 4D 时空,成为 3D 视觉领域的一个难题。

然而,受限于硬件成本与数据传输带宽,目前绝大多数 4D 采集阵列的最高帧率仅约 30 FPS;相比之下,传统高速摄影通常需要 120 FPS 乃至更高。简单升级相机硬件不仅价格高昂,还会带来指数级增长的数据通量,难以在大规模部署中落地。另一条改变的思路是在重建阶段 “补帧”。近期,例如 4D 高斯溅射(4D Gaussian Splatting)等动态场景重建方法能在简单运动中通过稀疏时序输入合成连续帧,变相提升帧率,但面对布料摆动、高速旋转等非线性复杂运动,中间帧仍会出现运动不连续、伪影明显的问题。

于是,一个自然且关键的问题被提出:能否仅利用低帧率相机阵列,准确恢复出高质量的高速运动 4D 模型?正是在这一动机下,我们提出 “异步采集 + 视频扩散模型修复” 的软硬协同解决方案,为高速 4D 重建开辟了一条低成本、高质量的新路径,实现了仅利用 30 FPS 的普通相机,恢复出相当于 100-200 FPS 的高质量动态细节。

  • 论文标题:4DSloMo: 4D Reconstruction for High Speed Scene

  • with Asynchronous Capture

  • 项目主页:https://openimaginglab.github.io/4DSloMo

  • 论文:https://arxiv.org/pdf/2507.05163

  • 代码:https://github.com/OpenImagingLab/4DSloMo

硬件革新:异步捕捉,让相机 “错峰拍摄”

核心思路,是突破单个相机的速度瓶颈,通过让多个相机协同工作,实现一种 “接力式” 的拍摄方案。传统的捕捉方案是让相机阵列的所有相机在同一时刻拍照。而本文的异步捕捉 (Asynchronous Capture) 方案,则是人为地给不同相机或相机组设置一个微小的启动延迟。

传统同步方案(左),所有相机在同一时间点(如 t=0, t=0.04s)捕捉。我们的异步方案(右),通过错开相机 2 的启动时间,在 0s 和 0.04s 之间插入了一个新的捕捉点(t=0.02s),有效帧率直接翻倍。

想象一下,8 台 25 FPS 的相机,如果我们将它们分成 4 组,每组交替启动,就能将时间切片切得更细,实现 100 FPS 的有效捕捉帧率;如果分成 8 组,甚至能达到 200 FPS!整个过程无需任何额外的硬件成本,却在时间维度上获得了前所未有的信息密度。

软件革新:视频扩散模型,为 4D 重建 “精装修”

异步捕捉虽然解决了时间分辨率的问题,但也带来了一个新的挑战:在任何一个特定的时间点,参与拍摄的相机数量变少了,这会导致 “稀疏视角” 问题,从而在初步的 4D 重建结果中产生 “浮块” 等视觉伪影。为了解决这个问题,我们训练了一个专门用于修复 4D 重建伪影的视频扩散模型 (Artifact-fix Video Diffusion Model)。

该模型的核心功能是接收一个包含重建伪影的视频作为输入 ,并生成一个精修后的高质量视频作为输出。这里的关键思想是,作为输入的视频虽然在视觉上不完美,但它为扩散模型提供了修复所需的关键时空上下文 (Spatio-temporal Context)—— 即场景的正确空间结构和物体的核心运动信息。模型利用这些上下文作为引导,专注于去除伪影并补全细节。

为了实现这一功能,我们构建了一个针对性的训练数据集。我们通过在高质量的 4D 数据上模拟异步捕捉过程,生成包含典型伪影的降质视频 。随后,我们将这些降质视频与原始的真值视频 (Ground Truth) 配对,通过对一个大规模预训练视频模型进行微调 (Fine-tuning),使其学习从包含伪影的输入到清晰输出的映射关系。

与常见的图像扩散模型相比,我们使用视频模型的核心优势在于保证 “时间一致性 (Temporal Consistency)”。逐帧修复容易在连续帧之间引入纹理闪烁等不一致问题,而我们的视频模型能够利用时序先验,在去除伪影的同时,生成在时间维度上连贯、平滑的动态结果。

整体流程:一个 “重建 - 优化” 的迭代框架

我们的方法将硬件捕捉与 AI 算法相结合,构建了一个迭代式的优化框架:

1. 初步重建 (Initial Reconstruction):首先,利用异步捕捉的视频数据,重建一个初步的 4D 高斯模型。该模型能捕捉高速动态,但存在视觉伪影。

2. 生成伪真值 (Pseudo Ground Truth Generation):接着,使用初步模型渲染出包含伪影的视频。这些视频将作为我们视频扩散模型的条件输入。

3. 视频增强 (Video Enhancement):将渲染视频送入视频扩散模型。模型负责去除伪影并提升视频质量,输出增强后的视频。

4. 模型优化 (Model Optimization):最后,将增强后的高质量视频作为新的监督信号 (Supervision Signal),用于进一步优化 4D 高斯模型,从而显著提升最终的重建质量。

整体框架:异步视频 → 初步重建 → 视频增强 → 优化 4D 模型。

方法效果

在 DNA-Rendering 和 Neural3DV 两大公开数据集的测试中,我们的方法在峰值信噪比(PSNR)、结构相似性(SSIM)和感知质量(LPIPS)三项核心指标上,超越了包括 K-Planes, 4DGS, GS4D 在内的多种当前顶尖(SOTA)方法。

为了在真实世界中验证我们的想法,我们专门搭建了一套包含 12 个 25 FPS 相机的多视角捕捉系统。实验证明,即使在真实、复杂的异步捕捉环境下,我们的方法依然能够稳健地重建出高质量、时空一致的 4D 内容。

本文仅做学术分享,如有侵权,请联系删文。

  • 3D视觉1V1论文辅导

3D视觉1V1论文辅导来啦!

3D视觉学习圈子

「3D视觉从入门到精通」知识星球(点开有惊喜) !星球内新增20多门3D视觉系统课程、入门环境配置教程、多场顶会直播、顶会论文最新解读、3D视觉算法源码、求职招聘等。想要入门3D视觉、做项目、搞科研,欢迎扫码加入

3D视觉全栈学习课程:www.3dcver.com

3D视觉交流群成立啦!

扫码添加微信,备注:方向+单位,邀你入3D视觉交流群!
http://www.jsqmd.com/news/104048/

相关文章:

  • vue基于springboot的铁路火车接发车课程作业培训考试系统证书
  • vue基于springboot的农业合作社果蔬批发农产品商城信息管理系统的设计与实现
  • 28、量子计算:机遇、挑战与未来展望
  • EmotiVoice模型鲁棒性测试:噪声文本输入下的表现
  • IROS‘25冠军 | X-VLA重磅开源,全面刷新机器人基准性能记录
  • 【路灯调压节能装置,路灯节电器】沃思智能
  • vue基于springboot的同城社区篮球队管理系统 体育运动篮球赛事预约系统
  • 计算机毕设Java美文推荐系统 基于Java的美文推荐平台设计与实现 Java技术驱动的美文推荐系统开发
  • EmotiVoice能否生成方言情感语音?粤语、川话实测
  • 纠结@Autowired报黄?我踩坑后理清的Spring注入那些事儿
  • 计算机毕设Java美食推荐系统 基于Java的美食推荐平台设计与实现 Java技术驱动的美食推荐系统开发
  • 高保真语音生成:EmotiVoice在有声内容领域的应用
  • vue基于springboot的数字化高校宿舍报修出入登记调换宿舍管理系统的实现
  • vue基于springboot的数据结构课程知识库在线答疑系统代码
  • 给数组装上超能力:JavaScript数组方法趣味指南
  • vue基于springboot的企业员工考勤加班人事培训管理系统设计与实现可视化
  • 五金零件自动整列效率对比:人工2000件/时 vs 整列机15000件/时的综合分析
  • Java零基础入门讲解,从小白到大黑,收藏这篇就够了
  • UV硅油涂布机选购指南:价格、品牌与性价比分析 - mypinpai
  • 通过局部与全局上下文设定答案选择新标准
  • 谁是TOP1?上海市青浦区自建房评测排行榜 + 真实建房案例参考 - 苏木2025
  • 2025年北京刑事辩护靠谱律师律所年度排行榜,专业刑事辩护 - myqiye
  • 揭秘靠谱UV硅油涂布机服务商与生产企业 - myqiye
  • 2025年诚信的元器件失效分析企业排行榜,有实力的元器件失效 - 工业推荐榜
  • 2025年北京美国有机产品认证查询公司权威推荐榜单:美国有机产品认证图标/美国有机产品认证/美国有机产品认证流程源头公司精选 - 品牌推荐官
  • 2025年服务不错的橡胶失效分析品牌企业排行榜,高性价比公司 - 工业推荐榜
  • 国内知名的4A广告公司有哪些?揭秘行业标杆与创新力量 - 博客万
  • 安徽省亳州市自建房设计公司哪家强?2026年最新权威靠谱测评榜单抢先看 - 苏木2025
  • 47_Spring AI 干货笔记之图像模型 API
  • 天津滨海新区全域口碑第一!佰瑞20年专攻汉沽老房/大港海景房,装修零踩坑 - 品牌智鉴榜