当前位置：首页 > news >正文

3D重建模型“会看”不会“改”？VGGT-Edit最高120倍加速，让3D编辑接近实时交互

news 2026/7/21 10:18:06

【导语：当前3D重建模型虽能快速重建3D场景，但在编辑3D世界方面存在难题。来自多机构的研究团队提出原生3D编辑框架VGGT-Edit，在多个维度超越现有方法，让3D编辑接近实时交互。】

3D重建模型编辑难题待解

从NeRF到83D Gaussian Splatting等前馈式3D重建模型，进展迅速，能几秒内用几张图片重建完整3D场景。然而，这些模型能理解三维世界，却难以修改，涉及复杂编辑时，现有方法易崩溃，如椅子视角不一致、背景变形等，这对机器人、AR/VR等场景是致命问题。

VGGT-Edit：原生3D编辑新思路

VGGT-Edit核心思路是直接在3D空间完成编辑，基于VGGT-Like前馈式重建模型，采用残差场预测机制，保留原始场景稳定3D结构，只学习局部变化，让未改动背景区域更稳定。

其还设计了深度同步文本注入机制，让文本语义和3D空间特征在同一深度层级持续同步，同时有视角重要性加权，使多视角编辑结果更稳定。

专为3D编辑设计的编辑头与数据集

VGGT-Edit有专门面向3D编辑任务的编辑头，额外设计编辑分支预测场景局部变化，学习哪些区域保持不变、哪些需编辑及编辑后多视角一致，让VGGT-Like模型具备编辑能力。

团队构建了规模接近10万组的DeltaScene数据集，覆盖多种场景，数据生成流程高度自动化，确保模型学习不同视角下的空间一致。

性能提升：接近实时交互与理解空间变化

在DeltaScene测试集上，VGGT-Edit在语义一致性、多视角稳定性、推理速度三个维度超现有方法，单次编辑约5秒，最高实现120倍加速，让3D编辑接近实时交互。

实验显示，输入训练中未出现的指令，模型也能成功编辑，说明它开始理解文本语义到3D空间变化的映射，推动3D编辑向自由、稳定、实时修改世界迈进。

编辑观点：VGGT-Edit解决了3D重建模型编辑难题，其创新机制和高效性能为3D编辑带来突破，有望推动机器人、AR/VR等领域发展。

查看全文

http://www.jsqmd.com/news/898741/

广州学校标识标牌定制常见问题解答（2026专家版） - 资讯纵览

鸣潮游戏自动化终极指南：如何用智能助手解放双手，实现高效后台运行

在银河麒麟与飞腾平台上从源码构建Qt 5.9开发环境的实战解析

2026年平价好用姨妈巾品牌深度分析：选型规则与高性价比品牌推荐 - 万事通达

2026年合肥灭蟑螂公司｜合肥专业灭蟑螂认准净安虫控，根除蟑螂杜绝反复繁殖 - 资讯纵览

ROS多机协同实战：从零搭建主从机通信网络

2026年安平车间隔离护栏网厂家推荐及技巧分享 - 资讯纵览

SpringBoot+Vue宠物医院项目实战：从零到部署，手把手教你搞定RBAC权限与多端登录

海南口碑好的geo优化企业 - 资讯纵览

辽宁省营口CPPMSCMP官网报考入口,官方授权双证报考中心 - 众智商学院课程中心

别再只盯着安装了！Agile Controller-Campus部署后，如何用华为交换机做802.1X认证的完整联调指南

RTX 5070 Ti vs RTX 4090 Ti对比专业数码硬件对比工具网站hmc-tech.com 网站介绍

使用Python配合Taotoken快速搭建一个多模型对话测试工具

从EFT/ESD到辐射：电机控制系统EMC设计实战与标准解析

2026年10款降AIGC网站横评：最高AI率100%直降至0.12% - 降AI小能手

2026年成人纸尿裤经济型产品选购全攻略：性价比、品质与场景适配的综合考量 - 万事通达

3天搭建本地缠论量化系统：告别手工画线，拥抱自动分析新纪元

PDF 组件里文字没渲染出来，只显示了线条（或者空白）

营收暴增68%，利润却腰斩，宇树科技的IPO是“真香”还是“惊吓”？

2026年BarTender公司推荐：五大王牌排名实测 - 资讯纵览

ROS2 Foxy下，用C++搞定六轴IMU数据解析与Rviz2实时姿态显示的完整流程

3分钟搞定：Mac免费读写NTFS硬盘的终极指南

合肥白蚁防治公司｜合肥专业灭白蚁认准净安虫控，无损治蚁+超长质保防复发 - 资讯纵览

软硬协同噪声抑制：从硬件滤波到智能优化VMD的工程实践

主板南北桥芯片：从核心枢纽到外围管家，一文读懂其协同与分工

Adobe-GenP 3.0：免费解锁Adobe Creative Cloud的终极指南

气象数据处理实战：用CDO和grib_copy搞定GRIB文件合并与格式转换（附避坑要点）

【小白也能学会】企业微信机器人关联 OpenClaw 配置方法（包含安装包）

pot-desktop跨平台翻译工具终极指南：15种语音朗读功能深度解析

VMware Workstation Pro 17免费激活终极指南：解锁完整虚拟化体验的5个关键

3D重建模型编辑难题待解

VGGT-Edit：原生3D编辑新思路

专为3D编辑设计的编辑头与数据集

性能提升：接近实时交互与理解空间变化

相关文章：