ICML‘26开源 | AmbiSuR:首次直击3DGS光度歧义!全新三维重建精度SOTA,原生支持VGGT-Ω/DA3即插即用!
点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达
一作投稿授权发布 | 来源:3D视觉工坊
「3D视觉从入门到精通」知识星球(点开有惊喜) !星球内有20多门3D视觉系统课程、3DGS独家系列视频教程、顶会论文最新解读、海量3D视觉行业源码、项目承接、求职招聘等。想要入门3D视觉、做项目、搞科研,欢迎加入!
论文信息
标题:Revisiting Photometric Ambiguity for Accurate Gaussian-Splatting Surface Reconstruction
作者:Jiahe Li, Jiawei Zhang, Xiao Bai, Jin Zheng, Xiaohan Yu, Lin Gu, Gim Hee Lee
机构:北京航空航天大学、新加坡国立大学、Macquarie University、Tohoku University
论文:https://arxiv.org/abs/2605.12494
代码:https://github.com/Fictionarry/AmbiSuR
项目主页:https://fictionarry.github.io/AmbiSuR-Proj/
导读
基于3D高斯泼溅(3DGS)的可微渲染在表面重建中效果已取得长足进步,但普遍存在的光度多义性仍是关键瓶颈。现有方法或仅在特定场景进行复杂光线建模,或粗略引入外部正则化,仍未从根本上分析解决该问题。本文提出AmbiSuR框架,从3DGS表征的内在原理出发,揭示了球谐函数作为“多义性自指示器”的潜力。该方法结合基元截断与光线-颜色一致性约束,形成一种内生消歧机制,优化过程无需额外冗余计算,即可显著提升几何重建精度,并对多视角深度与单目深度先验均具强适应性。该工作目前已被ICML 2026接收。
效果展示
(a) 在光度约束模糊的挑战性场景中,以往方法即使有先验引导,也常重建出错误几何。 在该具有挑战性且广泛存在的情况下,AmbiSuR的几何重建精度优势显著。在DTU、TnT等数据集上,AmbiSuR的重建精度和鲁棒性均显著超越Neuralangelo、GeoSVR等前沿方法。
(b) AmbiSuR通过基元截断和光线-颜色一致性,消除冗余基元,恢复清晰、准确的表面。
(c) 基于球谐系数的多义性指示器精准定位高风险基元,实现细粒度正则化。
(d) 重现精确的真实世界复杂几何。
引言
从多视角图像恢复精确3D几何,是计算机视觉的长期挑战。3DGS凭借高效显式表征推动了神经渲染发展,但基于光度一致性的优化在面对弱纹理、镜面反射、视角覆盖不足等情形时,常因光度多义性而失效,产生过度重建或几何错乱。已有改进策略中,基于光线追踪的方法仅针对反射场景,而全局深度正则化则易引入先验偏差并损害纹理区域的细节。
为从根源上应对该问题,本文从表征与监督两个基础维度,系统审视了3DGS在表面重建中的光度多义性。分析发现,高斯基元固有的大面积低不透明度边缘区域因梯度反馈微弱,易发生不受控膨胀;同时,像素级的混合颜色监督是一个不适定问题,优化器倾向于堆叠冗余基元来拟合目标颜色,而非恢复一个确定的物理表面。此外,在监督层面,存在冲突的光度信号会驱使模型利用高自由度的球谐系数强行补偿残差,造成几何误差被烘焙进颜色表达。
基于以上分析,我们提出AmbiSuR框架,其核心包括:1)揭示高阶球谐系数天然具备量化光度多义性的能力,并设计双端指示机制以精准标定高风险基元。2)提出基元截断与光线-颜色一致性,从表征源头消除弱梯度膨胀与混合歧义。3)构建无定形局部正则化器,仅在多义性基元上施加几何先验,在修正几何的同时保护正确的重建细节。4)在多个标准数据集上取得最优重建精度,并验证了框架对不同几何先验的强兼容性。
主要贡献
一种高斯溅射光度消歧模块,用于处理3DGS中两种固有的基元级歧义,约束不适定的几何求解,以形成确定的表面。
一种球谐函数多义性自指示机制,释放了球谐系数自身指示模糊约束的潜能,并据此用几何先验来补偿重建。
一个AmbiSuR完整框架,整合上述设计,在多种挑战性场景下实现了优于现有方法的表面重建效果。
方法
AmbiSuR的整体流程如图1所示,包含表征层与监督层的双阶段干预。
在表征层,光度消歧模块由两部分组成:1) 高斯基元截断:以标准差界定基元核心,在计算渲染不透明度时丢弃边缘,阻断弱梯度引发的膨胀,迫使基元保持紧凑。2) 光线-颜色一致性:沿光线计算各基元颜色相对于混合期望颜色的加权方差,约束同一表面交点的基元具备相近光学属性,有效抑制由冗余基元层叠造成的伪影。
在监督层,我们设计了一种基于球谐函数的内在指示器。根据球面正交性,视点相关颜色的方差与高阶球谐系数的平方和成正比,因此定义指示量I_SH为该范数。进一步提出双端指示:I_SH值处于顶部百分位(如前5%)的基元,表明其面临强冲突约束,多对应几何突变或强反光区域;值处于底部百分位(如后10%)的基元,则往往缺乏足够的光度监督(图4)。依此动态圈定高风险基元集合,并施以由深度图导出的法线先验进行局部约束,且在微调时冻结其缩放与不透明度,形成无定形局部正则化器,实现参数级精细干预。
为展现通用性,我们提出两种变体:1. 标准版本AmbiSuR,利用尺度深度进行初始化和正则化;2. 单目版本AmbiSuR-Mono,仅使用单目深度先验与SfM稀疏点云初始化,在受限条件下依然有效。由于已脱离先验质量与类型的强依赖,两种变体框架均可原生兼容VGGT-Ω/DA3等各类先进先验模型。
实验结果
在DTU、Tanks and Temples (TnT) 和 Mip-NeRF 360等数据集上的评估显示,AmbiSuR在精度、细节与鲁棒性方面均具优势。
定量对比:DTU数据集上,标准AmbiSuR与AmbiSuR-Mono均取得最优倒角距离0.46,超越Neuralangelo和最新体素方法GeoSVR。在包含复杂光照与大规模场景的TnT上,F1分数分别达0.576和0.589,即使在单目深度尺度模糊的情况下,仍稳定超越MILo、GeoSVR等强基线(文中表1、表2)。值得注意的是,方法在未采用最先进骨架的情况下,性能已比肩或超越同期方法。
定性评估:在镜面高光和纹理缺失区域,传统方法常产生混乱的过度重建表面,而AmbiSuR能恢复出平滑准确的几何。对于形状复杂的物体,重建出的网格边缘清晰、纹理分明,有效避免了过度平滑或塌陷。
总结&未来工作
本文重新审视了光度多义性在3DGS表面重建中的核心瓶颈地位,并提出内生消歧框架AmbiSuR。通过将球谐函数拓展为多义性自指示器,并辅以基元截断与光线-颜色一致性,该方法无需繁复的冗余计算,仅依赖3DGS核心计算即可实现几何重建的自我识错,与现有架构高度兼容,在多个基准上达到了全面的最佳重建精度。该方法为现实世界的鲁棒3D几何重建提供了启发式的思路,有助于推动相关重建任务在真实应用场景中的进一步落地。
本文仅做学术分享,如有侵权,请联系删文。
3D视觉方向论文辅导来啦!可辅导SCI期刊、CCF会议、本硕博毕设、核心期刊等。
添加微信:cv3d001,备注:姓名+方向+单位,邀请入群。
