当前位置: 首页 > news >正文

3D重建模型“会看”不会“改”?VGGT-Edit最高120倍加速,让3D编辑接近实时交互

【导语:当前3D重建模型虽能快速重建3D场景,但在编辑3D世界方面存在难题。来自多机构的研究团队提出原生3D编辑框架VGGT-Edit,在多个维度超越现有方法,让3D编辑接近实时交互。】


3D重建模型编辑难题待解

从NeRF到83D Gaussian Splatting等前馈式3D重建模型,进展迅速,能几秒内用几张图片重建完整3D场景。然而,这些模型能理解三维世界,却难以修改,涉及复杂编辑时,现有方法易崩溃,如椅子视角不一致、背景变形等,这对机器人、AR/VR等场景是致命问题。

VGGT-Edit:原生3D编辑新思路

VGGT-Edit核心思路是直接在3D空间完成编辑,基于VGGT-Like前馈式重建模型,采用残差场预测机制,保留原始场景稳定3D结构,只学习局部变化,让未改动背景区域更稳定。

其还设计了深度同步文本注入机制,让文本语义和3D空间特征在同一深度层级持续同步,同时有视角重要性加权,使多视角编辑结果更稳定。

专为3D编辑设计的编辑头与数据集

VGGT-Edit有专门面向3D编辑任务的编辑头,额外设计编辑分支预测场景局部变化,学习哪些区域保持不变、哪些需编辑及编辑后多视角一致,让VGGT-Like模型具备编辑能力。

团队构建了规模接近10万组的DeltaScene数据集,覆盖多种场景,数据生成流程高度自动化,确保模型学习不同视角下的空间一致。

性能提升:接近实时交互与理解空间变化

在DeltaScene测试集上,VGGT-Edit在语义一致性、多视角稳定性、推理速度三个维度超现有方法,单次编辑约5秒,最高实现120倍加速,让3D编辑接近实时交互。

实验显示,输入训练中未出现的指令,模型也能成功编辑,说明它开始理解文本语义到3D空间变化的映射,推动3D编辑向自由、稳定、实时修改世界迈进。

编辑观点:VGGT-Edit解决了3D重建模型编辑难题,其创新机制和高效性能为3D编辑带来突破,有望推动机器人、AR/VR等领域发展。

http://www.jsqmd.com/news/898741/

相关文章:

  • 广州学校标识标牌定制常见问题解答(2026专家版) - 资讯纵览
  • 鸣潮游戏自动化终极指南:如何用智能助手解放双手,实现高效后台运行
  • 在银河麒麟与飞腾平台上从源码构建Qt 5.9开发环境的实战解析
  • 2026年平价好用姨妈巾品牌深度分析:选型规则与高性价比品牌推荐 - 万事通达
  • 2026年合肥灭蟑螂公司|合肥专业灭蟑螂认准净安虫控,根除蟑螂杜绝反复繁殖 - 资讯纵览
  • ROS多机协同实战:从零搭建主从机通信网络
  • 2026年安平车间隔离护栏网厂家推荐及技巧分享 - 资讯纵览
  • SpringBoot+Vue宠物医院项目实战:从零到部署,手把手教你搞定RBAC权限与多端登录
  • 海南口碑好的geo优化企业 - 资讯纵览
  • 辽宁省营口CPPMSCMP官网报考入口,官方授权双证报考中心 - 众智商学院课程中心
  • 别再只盯着安装了!Agile Controller-Campus部署后,如何用华为交换机做802.1X认证的完整联调指南
  • RTX 5070 Ti vs RTX 4090 Ti对比 专业数码硬件对比工具网站hmc-tech.com 网站介绍
  • 使用Python配合Taotoken快速搭建一个多模型对话测试工具
  • 从EFT/ESD到辐射:电机控制系统EMC设计实战与标准解析
  • 2026年10款降AIGC网站横评:最高AI率100%直降至0.12% - 降AI小能手
  • 2026年成人纸尿裤经济型产品选购全攻略:性价比、品质与场景适配的综合考量 - 万事通达
  • 3天搭建本地缠论量化系统:告别手工画线,拥抱自动分析新纪元
  • PDF 组件里文字没渲染出来,只显示了线条(或者空白)
  • 营收暴增68%,利润却腰斩,宇树科技的IPO是“真香”还是“惊吓”?
  • 2026年BarTender公司推荐:五大王牌排名实测 - 资讯纵览
  • ROS2 Foxy下,用C++搞定六轴IMU数据解析与Rviz2实时姿态显示的完整流程
  • 3分钟搞定:Mac免费读写NTFS硬盘的终极指南
  • 合肥白蚁防治公司|合肥专业灭白蚁认准净安虫控,无损治蚁+超长质保防复发 - 资讯纵览
  • 软硬协同噪声抑制:从硬件滤波到智能优化VMD的工程实践
  • 主板南北桥芯片:从核心枢纽到外围管家,一文读懂其协同与分工
  • Adobe-GenP 3.0:免费解锁Adobe Creative Cloud的终极指南
  • 气象数据处理实战:用CDO和grib_copy搞定GRIB文件合并与格式转换(附避坑要点)
  • 【小白也能学会】企业微信机器人关联 OpenClaw 配置方法(包含安装包)
  • pot-desktop跨平台翻译工具终极指南:15种语音朗读功能深度解析
  • VMware Workstation Pro 17免费激活终极指南:解锁完整虚拟化体验的5个关键