当前位置: 首页 > news >正文

相机标定新突破!模糊图像+标定手抖也能高精度标定

点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

来源:3D视觉工坊

「3D视觉从入门到精通」知识星球(点开有惊喜) !星球内有20多门3D视觉系统课程、300+场顶会讲解、顶会论文最新解读、海量3D视觉行业源码、项目承接、求职招聘等。想要入门3D视觉、做项目、搞科研,欢迎加入

相机标定是三维视觉技术的核心基石,其精度直接决定了立体匹配、三维重建、视觉SLAM、自动驾驶等下游任务的表现上限。传统参数化相机标定模型依赖全局透镜畸变函数假设,存在固有的系统方向偏差;而通用相机模型通过对每个像素对应的观测光线进行独立标定,能够彻底消除这一系统误差,实现更高的标定精度。但通用相机标定需要上千张图像覆盖完整像素网格,采集过程中运动模糊几乎无法避免,而现有标定方法均要求输入清晰图像,通用去模糊预处理又无法满足标定所需的亚像素几何保真度,同时还存在特征提取与去模糊的循环依赖、去卷积平移歧义破坏几何精度等核心难题。

一、研究背景与核心科学问题

1.1 相机标定技术的两大分支与发展现状

相机标定的核心目标,是建立三维空间中的观测光线与二维图像像素之间的映射关系,是所有三维视觉任务的前置基础。经过数十年的发展,相机模型主要分为两大核心类别:参数化相机模型(Parametric Model)与通用相机模型(Generic Model),二者的核心差异与优劣势如图1所示。

图1:展示参数化模型与通用模型的核心对比,后者可实现更高精度,但需要数量远多于前者的标定图像

参数化相机模型是工业界与学术界最常用的标定方案,其核心假设是透镜畸变符合全局的函数形式,通过少量参数即可完整描述相机的成像映射关系。经典的参数化模型包括适用于普通针孔相机的Brown-Conrady模型、张正友标定法,以及适用于鱼眼相机的Kannala-Brandt模型、Scaramuzza模型等。这类模型的核心优势在于标定流程简单,仅需十几张精心拍摄的清晰图像即可完成标定,对采集设备与操作的门槛极低。但参数化模型的固有缺陷也十分显著:其全局函数假设无法完全适配真实镜头的复杂畸变(如非球面透镜、弯月形透镜、曲面反射镜等非透视成像系统),会产生系统性的重投影方向偏差,即使实现了亚像素级的重投影误差,也会对立体深度估计等依赖连续图像信息的下游任务产生负面影响。

通用相机模型(也被称为射线模型、表面模型)的出现,正是为了解决参数化模型的系统偏差问题。该模型由Grossberg和Nayar于2001年首次提出,其核心思想是摒弃全局畸变函数的假设,对每个图像像素对应的三维光线进行独立标定,无需对镜头畸变做任何先验约束。后续研究不断优化通用相机标定的流程与精度:Dunne等人利用相位图案实现了密集的光线映射标定,Beck和Stiller通过B样条插值在离散网格上拟合通用模型,Schöps等人则提出了比棋盘格具备更丰富梯度信息的星形标定靶标,配合完整的光束平差(BA)流水线,实现了极高精度的通用相机标定,同时通过实验证明:即使通用模型仅实现了微小的亚像素标定精度提升,也能显著优化立体深度估计等下游任务的表现。

1.2 通用相机标定的核心痛点与未解决难题

尽管通用相机模型具备显著的精度优势,但其在实际应用中面临着一个无法回避的工程瓶颈:数据采集难度极高。为了覆盖完整的像素网格,实现全分辨率的光线标定,通用相机标定往往需要采集上千张不同位姿的标定板图像,远多于参数化标定所需的十几张图像。这一特性带来了两个直接问题:

  1. 对于个人用户与非专业采集场景,手持采集上千张图像的过程中,运动模糊几乎无法避免,尤其是低帧率的低成本相机,模糊问题会进一步加剧;

  2. 若直接丢弃采集到的模糊帧,不仅会浪费大量已采集的像素覆盖数据,还会大幅延长数据采集的时间成本,进一步提高通用标定的使用门槛。

面对模糊图像的问题,现有技术方案存在三大无法突破的核心难题,这也是本论文的核心研究切入点:

第一,通用去模糊预处理无法满足标定的亚像素几何保真度要求。现有盲去模糊、非盲去模糊算法的核心优化目标是提升图像的视觉观感,而非保证特征点的几何位置精度。对于标定任务而言,即使去模糊后的图像视觉效果良好,只要特征点位置存在0.1像素级的偏差,就会直接导致标定精度的严重下降,无法满足通用标定的精度要求。

第二,特征提取与PSF估计的循环依赖困境。现有的基于标定图案的点扩散函数(PSF)估计方法,均有一个核心前提:标定图案到图像的映射关系已经通过独立的特征提取步骤预先获知。但在运动模糊的图像中,传统的角点、特征点检测算法无法精准定位特征位置,无法提供图案到图像的映射关系;而没有映射关系,又无法完成精准的PSF估计与去模糊,形成了无法破解的循环依赖。

第三,去卷积固有的平移歧义问题,直接破坏标定的几何精度。在空间不变的模糊模型中,观测图像本质上是清晰潜像与模糊核的卷积结果叠加成像噪声。去卷积的目标是从模糊图像中还原清晰潜像与模糊核,但由于卷积的平移等变性,清晰潜像的任意平移误差,都会被模糊核以大小相等、方向相反的位移完全抵消,最终卷积得到的模糊图像完全一致,如图2所示。

图2:展示去卷积的平移歧义问题:标准去卷积可恢复视觉合理的图像,但由于卷积的平移等变性,特征位置存在任意平移的歧义,直接破坏标定的几何精度

对于仅关注视觉质量的普通去模糊任务,这种平移歧义完全无害;但对于相机标定任务,特征点的亚像素位置是标定的核心输入,平移歧义会直接导致特征位置的几何精度完全失效,这也是现有去模糊技术无法直接应用于标定预处理的核心原因。

基于上述背景,本论文首次提出了一套可直接利用运动模糊图像完成通用相机标定的完整框架,同时解决了特征提取与去模糊的循环依赖、空间变化PSF估计、去卷积平移歧义三大核心难题,实现了模糊图像的亚像素级特征提取,为通用相机标定的工程落地扫清了关键障碍。

二、核心方法框架深度解析

本论文的核心思路是:摒弃传统的“先去模糊、后特征提取”的串行思路,通过对局部潜像进行单应性参数化,实现特征位置与空间变化PSF的联合估计,同时通过局部块间几何约束与全局参数化相机对齐,彻底解决去卷积的平移歧义问题,最终输出适用于通用相机标定的亚像素精度特征点。

方法的整体框架如图3所示,主要分为四大核心模块:局部去卷积、局部对齐、全局对齐与偏差补偿,同时通过可微的星形标定图案近似,实现了基于梯度的端到端优化。本节将对每个模块进行深度解析,以文字化总结呈现所有核心数学逻辑与设计原理。

图3:展示所提方法的整体框架:通过局部单应性与光照参数替代传统的基于特征的全局映射来描述潜像,通过几何约束保证块间一致性,通过与标定好的参数化相机对齐解决全局平移歧义

2.1 局部去卷积:打破循环依赖的核心创新

传统的标定与去模糊流程是串行的:先通过特征提取算法获取标定板的特征点,求解单应性矩阵,得到标定图案到图像的映射关系,再基于该映射关系进行PSF估计与去模糊。但在模糊图像中,特征提取失效,这一流程完全无法执行,形成了循环依赖。

本研究提出的单应性参数化局部去卷积,彻底打破了这一循环依赖。其核心创新思路是:不再将局部潜像视为数万个自由的像素值,而是将其参数化为“已知标定图案经单应性变换+线性光照校正”的结果。通过这一参数化,局部潜像的自由变量从数万个缩减到仅14个:8个单应性矩阵参数(3×3单应性矩阵具有8个自由度)+6个线性光照校正参数。这一设计不仅让图像内容与模糊核的联合估计从欠定问题变为良态问题,还能在优化过程中直接输出标定所需的几何映射关系,无需单独的特征提取步骤。

2.1.1 局部去卷积的核心优化逻辑

局部去卷积的核心优化目标,是让“模糊核与参数化潜像卷积后的结果”和实际观测到的模糊图像之间的误差最小,同时对模糊核施加正则化约束,避免优化过程中受噪声干扰出现过拟合。

整个参数化潜像的构建分为三个核心部分:

  1. 理想标定图案的几何变换:通过单应性矩阵,将已知的星形标定图案投影到图像局部区域,完整描述图案的几何位置与形变;

  2. 线性光照校正:通过空间变化的幅值系数与偏置系数,修正标定板光照不均匀、镜头渐晕、相机响应非线性等问题,两个系数均通过归一化图像坐标的线性函数建模,共计6个参数;

  3. 模糊核卷积:将参数化得到的潜像与模糊核进行卷积,模拟真实的模糊成像过程。

这一设计的核心优势在于,将原本高维度的像素级求解问题,转化为低维度的几何与光照参数求解问题,同时直接关联了标定所需的几何映射关系,彻底打破了特征提取与去模糊的循环依赖。

2.1.2 高效优化求解策略

本研究在PyTorch框架中实现了上述优化目标的全可微求解,采用交替优化的策略,将复杂的联合优化问题拆解为两个可高效求解的子问题,大幅提升了优化效率与收敛性:

  1. 固定单应性矩阵,解析求解模糊核与光照参数:当单应性矩阵固定时,标定图案的投影位置也随之固定,优化目标变为关于模糊核和光照参数的线性最小二乘问题,存在闭式解析解,可一步计算出最优的模糊核与光照参数,无需迭代优化;

  2. 固定模糊核与光照参数,梯度下降优化单应性矩阵:当模糊核和光照参数固定时,优化目标变为关于单应性矩阵的非线性优化问题,通过反向传播计算损失函数对单应性参数的梯度,采用梯度下降算法迭代优化,最终收敛到最优的单应性矩阵,实现标定图案的精准几何对齐。

这一交替优化策略,充分结合了线性子问题解析解的高效性与非线性子问题梯度优化的精准性,实现了单应性与PSF的联合、高效估计。

2.1.3 星形标定图案的全可微近似

要实现基于梯度的单应性优化,核心前提是理想标定图案的数值对单应性参数可求导。但原始的星形标定图案是分段常数的二值图像,边缘是阶跃式的跳变,无法直接求导,这是工程实现中的核心难点。

为了解决这一问题,本研究提出了星形标定图案的全可微近似方法,核心设计如下:

  1. 星形图案的数学化定义:标定靶标由周期为2的相同单元格拼接而成,每个单元格被等分为16个角向扇区,黑白交替,其黑白值可通过极角的正弦函数符号精准描述;

  2. 平滑可微近似:用平滑的sigmoid函数替代原本不可微的阶跃函数,得到连续可微的图案近似结果,同时通过可调参数控制边缘锐度,让近似结果尽可能接近原始的二值图案;

  3. 完整梯度推导:基于可微近似结果,完整推导了损失函数对单应性矩阵的梯度链式法则,同时在优化过程中,将光照参数通过解析最小二乘求解后从梯度流中分离,让梯度完全聚焦于图案边缘的几何对齐,进一步提升了单应性优化的稳定性与精度。

这一可微近似方法,是整个优化框架能够落地实现的关键基础,也是本研究的重要工程创新。

2.2 局部对齐:消除块间平移歧义与漂移累积

通过局部去卷积,我们可以得到每个图像块的单应性矩阵与PSF,但由于去卷积的平移歧义,相邻图像块的去卷积结果会出现重叠区域的不一致性:相邻块共享标定图案的顶点,但各自估计的单应性矩阵会让共享顶点的投影位置出现偏差,同时平移误差会随着区域生长不断累积,导致严重的漂移问题。

为了解决这一问题,本研究提出了基于共享顶点的局部对齐方法,通过相邻块的几何约束,消除块间的平移歧义,同时抑制漂移累积。

2.2.1 平移校正的单应性修正

首先,为每个图像块的估计单应性矩阵引入平移校正项,通过平移单应性矩阵对原始单应性进行修正,平移校正的参数为每个图像块的二维平移向量。引入平移校正后,优化的核心目标变为求解每个块的最优平移向量,让相邻块的共享顶点投影位置尽可能一致。

2.2.2 基于共享顶点的约束优化

对于每个图像块,考虑其上下左右4个相邻块,相邻块之间共享标定图案的顶点。局部对齐的优化目标,是最小化所有共享顶点在相邻块校正后单应性投影下的位置偏差平方和。

通过这一优化,相邻块的单应性矩阵通过共享顶点实现了几何耦合,每个块的平移歧义不再是独立的,而是受到相邻块的强约束,从而消除了块间的投影不一致性。同时,为了防止平移漂移的累积,本研究还在初始估计阶段后,通过PSF的强度加权质心进行校正重居中,让PSF始终保持在估计窗口的中心,进一步保证了优化的稳定性。

2.3 全局对齐与双线性偏差场补偿:消除全局平移歧义

局部对齐解决了相邻块之间的平移歧义,但整个图像的全局平移歧义仍然存在——所有图像块的单应性可能同时发生整体平移,这一整体平移无法通过局部约束消除,会直接导致特征点的全局位置偏差,破坏标定的几何精度。

为了彻底解决这一问题,本研究提出了基于参数化相机模型的全局对齐方法,同时通过连续双线性偏差场,补偿空间变化的PSF估计局部偏差,最终实现亚像素级的特征对齐精度。

2.3.1 误差分解与全局对齐的核心思路

首先,本研究对观测特征点与参数化模型投影点之间的误差进行了拆解,将其分为三个核心部分:去卷积带来的随机误差、局部对齐带来的随机误差、参数化模型固有的确定性系统方向偏差。其中前两个随机误差均为零均值的高斯噪声,在多帧观测的联合优化中,其影响会相互抵消;只有系统偏差是固定的、仅与光线方向相关的确定性误差。

基于这一分解,全局对齐的核心思路十分清晰:通过少量清晰图像标定出参数化相机模型,将其作为全局对齐的基准,通过鲁棒优化求解全局平移与相机位姿,消除去卷积带来的全局平移歧义,同时保留参数化模型的系统偏差,为后续的通用标定提供无偏的特征点。

2.3.2 全局对齐的鲁棒优化设计

全局对齐的核心优化目标,是求解全局平移向量与相机外参矩阵,最小化参数化模型投影点与全局平移校正后的观测点之间的重投影误差,同时采用鲁棒核函数抑制外点的影响,避免异常特征点干扰优化结果。

通过实验对比,本研究发现Huber鲁棒核函数的表现最优,能够有效抑制外点的干扰,实现最高的对齐精度。同时,本研究还引入了角度阈值过滤:当相机光轴与标定靶标法向的夹角小于π/10时,透视变换趋近于仿射变换,二维平移估计会变为病态问题,极易产生大的估计偏差。过滤掉这类帧后,能够有效消除大的估计偏差,进一步提升对齐的稳定性。

2.3.3 连续双线性偏差场的空间变化补偿

在实际实验中,研究人员发现全局对齐后的残差并非均匀分布,而是在图像平面上呈现出明显的空间结构——单一的全局平移无法补偿局部PSF估计带来的空间变化偏差。若采用离散的分象限方法,为每个象限求解独立的平移偏移,又会在象限边界引入人为的跳变不连续,与真实的平滑误差分布不符。

为了解决这一问题,本研究提出了连续双线性偏差场模型,将全局对齐后的残差建模为归一化网格坐标上的连续双线性函数,仅用8个参数即可完整描述整个图像平面的偏差分布,在保证空间连续性的同时,平滑补偿局部的空间变化偏差,不会出现边界跳变问题。

基于该双线性偏差场,全局对齐采用交替迭代的优化方案:

  1. 位姿更新步骤:给定当前的偏差场估计,对观测特征点进行偏差校正,通过PnP算法更新相机位姿,保证全局的几何刚性约束;

  2. 偏差场更新步骤:给定更新后的相机位姿,计算每个特征点的重投影残差,通过加权最小二乘拟合更新双线性偏差场的系数,其中权重由特征点的去卷积损失决定,高置信度的特征点在拟合中占据更高的权重。

这一交替优化过程,既保证了全局的刚性约束,又实现了对局部空间变化偏差的平滑补偿,彻底解决了单一全局平移的局限性,是实现亚像素级对齐精度的关键。

三、实验设计与结果分析

为了验证所提方法的有效性,本研究设计了三组递进式的实验:标定图案对比实验、全局对齐验证实验、真实世界采集数据的全流程评估实验,全面验证了方法的鲁棒性、精度与工程实用性。

3.1 标定图案对比实验:星形图案的噪声鲁棒性验证

本实验的核心目标,是验证星形标定图案相比传统棋盘格图案,在PSF估计任务中的噪声鲁棒性优势,为方法的标定靶标选择提供实验支撑。

3.1.1 实验设置

实验采用两种标定图案:传统棋盘格图案(仅包含两个相交的边缘方向)、星形图案(包含8个相交的边缘方向)。为了评估PSF恢复的泛化能力,实验采用Lucida Handwriting字形作为复杂的模糊核,将其反色、缩放为15×15像素,并通过高斯滤波平滑处理。在优化过程中,该字形模糊核是唯一的未知量,其余几何参数均保持固定,分别在无噪声、添加5%高斯噪声两种条件下,对比两种图案的PSF估计精度。

3.1.2 实验结果与分析

实验结果如图4所示,核心结论如下:

  1. 无噪声条件下,两种图案的PSF重建质量相当,均能实现高精度的模糊核估计,SSIM与PSNR指标无显著差异;

  2. 添加5%高斯噪声后,棋盘格图案的PSF估计效果出现严重退化,SSIM降至约0.58,PSNR降至13dB。其核心原因是棋盘格仅包含两个边缘方向,导致对角方向的PSF估计处于欠定状态,对随机噪声扰动极为敏感;

  3. 星形图案通过8个方向的边缘,实现了密集的频域覆盖,在5%高斯噪声下依然保持了极强的鲁棒性,SSIM维持在约0.96,PSNR高于22dB,远优于棋盘格图案。

图4:展示棋盘格与星形标定图案在四种PSF字形下的去卷积结果,分别对比无噪声与5%高斯噪声条件下的SSIM/PSNR指标

这一实验结果,充分证明了星形图案在噪声环境下的几何稳定性与PSF估计鲁棒性,是模糊环境下高精度标定的最优靶标选择,也为后续的全流程实验奠定了基础。

3.2 全局对齐验证实验:平移歧义消除效果验证

本实验为受控实验,核心目标是验证所提的全局对齐方法,能否有效消除去卷积带来的平移歧义,恢复特征点的精准几何位置。

3.2.1 实验设置

实验采用Schöps等人提供的D435I标定数据集,提取其中的特征点真值,为每帧图像的特征点引入±5像素范围内的随机平移,模拟去卷积过程中固有的平移歧义。实验采用20张均匀采样的图像,标定出Brown-Conrady参数化模型与标定板三维点坐标,作为全局对齐的基准。

实验对比了三种损失函数的对齐效果:Huber鲁棒核、算术均值、中位数,同时验证了π/10角度阈值过滤对对齐精度的提升效果,评价指标为中位/平均重投影误差。

3.2.2 实验结果与分析

实验的可视化结果如图5、图6所示,量化结果如表1所示,核心结论如下:

  1. 全局对齐的有效性:所提的对齐方法能够显著降低引入的随机平移偏移,让重投影方向的分布恢复均匀,彻底消除了平移歧义带来的系统性偏差;

  2. 损失函数对比:Huber鲁棒核函数实现了最高的对齐精度,在加入π/10角度阈值后,对齐误差达到了0.042像素,远优于算术均值与中位数损失,证明了鲁棒核函数对外点的强抑制能力;

  3. 角度阈值的作用:当光轴与靶标法向的夹角过小时,透视变换趋近于仿射变换,平移估计变为病态问题,会产生大的估计偏差。加入π/10的角度阈值过滤后,这类大偏差被完全消除,估计偏差与原始特征噪声呈现出强相关性,对齐精度与稳定性大幅提升。

图5:展示重投影方向(色相)与幅值的分布,从左到右依次为原始数据、随机平移数据、全局对齐后的数据

图6:展示不同损失函数与角度阈值下的平移偏差分布,横坐标为原始数据的中位重投影误差,纵坐标为Y方向估计偏差

表1:不同损失函数与角度阈值下的中位/平均重投影误差对比(单位:像素)

这一受控实验,充分证明了所提的全局对齐方法能够有效消除去卷积的平移歧义,实现亚像素级的特征对齐精度,为模糊图像的标定提供了核心保障。

3.3 真实世界评估实验:全流程方法的工程有效性验证

本实验在真实采集的模糊图像上,对所提方法的全流程进行了完整评估,验证其在实际应用场景中的有效性与实用性。

3.3.1 实验设置

实验采用Intel RealSense D435I全局快门相机,图像分辨率为1280×720,采集了两组数据:

  1. 模糊数据集:通过刻意的手持抖动,以15fps采集了204帧模糊图像,模拟普通用户的非专业采集场景;

  2. 清晰数据集:采集20张清晰图像,用于标定Brown-Conrady参数化模型与标定板三维点坐标,作为全局对齐的基准。

实验前,首先验证了D435I传感器的响应线性度,确认无需额外的辐射定标即可进行去卷积操作。实验中PSF估计窗口设置为17×17像素,通过局部去卷积、局部对齐、全局双线性偏差场对齐的全流程,最终评估特征点的对齐精度与标定可行性。

3.3.2 实验结果与分析

实验从四个维度对方法进行了全面评估,核心结果如下:

PSF估计与质心校正效果

图7展示了单张模糊图像的空间变化PSF场估计结果。可以清晰看到,无质心校正时,平移漂移的累积导致图像边界附近的PSF严重偏离中心、形状不规则;而加入质心校正重居中后,PSF估计结果具备了良好的空间一致性,运动模糊的方向在整个图像平面上平滑变化,完全符合真实手持抖动的运动模糊特性。

实验中,通过过滤模糊程度不足的帧,最终保留了42帧有效模糊图像用于后续处理。

图7:展示单张模糊图像的空间变化PSF场估计结果,左侧为无质心校正,右侧为加入校正重居中,底部为红色框选区域的PSF放大图

质量过滤的有效性

为了筛选出可靠的特征点,实验设计了两级质量过滤策略,采用两个核心评价指标:去卷积损失、边界能量比(BE,定义为PSF能量在估计窗口最外侧两像素环中的占比)。高BE值意味着真实PSF超出了估计窗口,发生了截断,会导致系统性的估计偏差,无论去卷积损失多低,结果都不可靠。

图8的统计结果验证了这一设计:BE>0.15的图像块,其去卷积损失出现系统性升高;而散焦主导的低模糊度图像,其损失更高、波动更大。基于此,实验采用两级过滤:首先剔除BE超过阈值的图像块,再剔除去卷积损失高于阈值的块,最终通过广度优先搜索从中心区域损失最低的种子块开始,保持网格的连通性。

图8:跨图像的PSF质量分析,左侧为损失与模糊尺寸的关系,右侧为损失与边界能量比的关系

对齐精度评估

图9展示了不同配置下,全局对齐后的中位重投影误差随损失阈值的变化曲线,对比了三种配置:原始单应性平移无任何过滤与局部对齐、仅BE过滤无局部对齐、全流程包含局部对齐与BE过滤。

实验结果显示,全流程方法在损失阈值为30时,实现了约0.08像素的中位对齐误差,远优于另外两种配置。这一结果充分证明:局部对齐、质量过滤、空间变化双线性偏差场补偿三者的结合,是实现亚像素级对齐精度的必要条件,缺一不可。

图9:不同配置下的中位重投影误差随损失阈值的变化曲线,误差棒为四分位距

标定可行性分析

通用相机标定的核心要求,是输入的特征点必须是无偏的——即特征误差是零均值的随机噪声,而非系统性的偏移。只有这样,增加特征点的数量才能提升每条光线的观测数与角度覆盖,最终提升通用标定的精度。

本研究实现的约0.08像素的对齐误差,通过误差分解的设计,其本质是零均值的随机噪声,去卷积与局部对齐的随机误差在多帧优化中会相互抵消,不会引入系统性的方向偏差。这意味着,通过本方法从模糊图像中提取的特征点,完全可以用于通用相机标定,能够有效提升标定的像素覆盖度,缩短采集时间,降低采集门槛。

四、技术创新点与行业应用价值

4.1 核心技术创新点

本论文是首个实现将运动模糊图像用于通用相机标定的研究工作,其核心创新点可总结为三大方面,彻底解决了现有技术的核心瓶颈:

第一,提出了单应性参数化的局部去卷积框架,打破了特征提取与去模糊的循环依赖。传统方法的串行流程在模糊图像中完全失效,而本研究通过将局部潜像参数化为已知标定图案的单应性变换+线性光照校正,将潜像的自由变量从数万个缩减到14个,实现了特征位置与PSF的联合估计,在优化过程中直接输出标定所需的几何映射,无需单独的特征提取步骤。同时,研究团队推导了星形标定图案的全可微近似方法,实现了基于梯度的单应性优化,为整个框架的工程落地奠定了基础。

第二,设计了块间几何约束的局部对齐方法,实现了高效的空间变化PSF估计。现有空间变化PSF去模糊方法需要全局求解,计算成本极高且处于欠定状态,而本研究通过相邻块共享的标定图案顶点,让相邻单应性矩阵实现几何耦合,在消除块间平移歧义的同时,无需全局去卷积即可实现空间变化的PSF估计,能够自然适配光学像差与运动模糊带来的PSF空间变化,突破了传统方法仅能处理单区域不变PSF的局限。

第三,提出了局部对齐+全局参数化对齐的方案,彻底解决了去卷积的平移歧义问题。这是本研究最核心的科学贡献之一,首次明确了去卷积平移歧义对标定任务的致命影响,并提出了完整的解决方案。通过局部块间约束消除块间平移漂移,通过全局参数化相机对齐消除整体平移歧义,同时通过连续双线性偏差场补偿空间变化的局部偏差,最终在真实模糊图像上实现了0.08像素的特征对齐精度,保证了标定所需的亚像素几何保真度。

4.2 行业应用价值

本研究的成果,为通用相机标定技术的工程落地扫清了关键障碍,具备极高的行业应用价值,主要体现在四个方面:

第一,大幅降低了通用相机标定的采集门槛。在此之前,通用相机标定需要采集上千张无模糊的清晰图像,对采集设备、操作熟练度要求极高,仅能在实验室环境中实现。而本研究的方法能够直接利用采集过程中的模糊帧,无需专业的高帧率相机,无需严格控制拍摄过程避免手抖,普通个人用户也能完成高精度的通用相机标定,让通用标定技术从实验室走向工业界与消费级场景成为可能。

第二,显著提升了标定数据的利用率,缩短采集时间。传统通用标定流程中,模糊帧会被直接丢弃,不仅浪费了大量的采集数据,还需要用户反复拍摄以覆盖完整的像素网格,采集时间极长。本研究的方法能够让模糊帧得到有效利用,大幅减少了所需的采集帧数,缩短了数据采集时间,提升了标定流程的效率。

第三,为三维视觉下游任务提供了更精准的标定基础。通用相机模型能够彻底消除参数化模型的系统方向偏差,而本研究的方法让通用标定的高精度优势能够在实际场景中充分发挥。更精准的相机标定,能够直接提升立体匹配、三维重建、视觉SLAM、自动驾驶环境感知、AR/VR场景交互等下游任务的精度与鲁棒性,为整个三维视觉行业的发展提供了底层支撑。

第四,开辟了模糊场景下相机标定技术的全新研究方向。本研究首次建立了模糊图像通用标定的完整框架,为后续研究提供了基础范式。基于本研究的成果,研究者可以进一步拓展到卷帘快门相机、大尺度运动模糊、散焦与运动混合模糊、无标定靶标的自然场景标定等更具挑战的场景,推动相机标定技术的持续发展。

五、总结与未来展望

本论文针对通用相机标定中运动模糊无法避免、现有方法无法处理模糊图像的核心痛点,首次提出了一套完整的基于模糊图像的通用相机标定框架。该框架通过单应性参数化的局部去卷积,实现了特征位置与空间变化PSF的联合估计,打破了特征提取与去模糊的循环依赖;通过块间共享顶点的几何约束,实现了高效的局部对齐,消除了块间平移歧义与漂移累积;通过全局参数化相机对齐与连续双线性偏差场补偿,彻底解决了去卷积固有的全局平移歧义问题,保证了特征点的亚像素几何精度。

实验结果充分验证了方法的有效性:在真实世界采集的手持抖动模糊图像上,该方法实现了约0.08像素的特征对齐误差,证明了运动模糊帧能够提供几何精准的特征点,完全适用于通用相机标定。该研究不仅解决了通用标定工程落地的核心瓶颈,还为模糊场景下的相机标定技术开辟了全新的研究方向。

本研究建立了模糊图像通用标定的初步框架,仍有大量的优化与拓展空间,未来的研究方向可聚焦于以下五个方面:

第一,整合相机运动先验,提升PSF估计的鲁棒性。手持相机的运动具备强平滑性先验,连续帧之间的相机运动与模糊核变化是连续的。未来可将这一运动先验整合到优化框架中,通过多帧之间的时序约束,进一步提升PSF估计的精度与鲁棒性,适配更大尺度的运动模糊场景。

第二,设计更鲁棒的PSF估计模型,适配复杂的混合模糊场景。真实场景中,图像模糊往往是运动模糊、散焦模糊、镜头像差的混合结果,且不同深度的物体会呈现不同的模糊特性。未来可设计更灵活的PSF参数化模型,结合深度信息,实现复杂混合模糊场景下的精准PSF估计,进一步拓展方法的适用场景。

第三,扩展到卷帘快门相机的标定。本研究针对的是全局快门相机,而消费级领域的绝大多数相机均为卷帘快门,其行曝光特性会导致图像出现时空变化的模糊与畸变,标定难度更高。未来可将本框架扩展到卷帘快门相机,同时估计相机的卷帘快门参数、运动轨迹与空间变化PSF,实现卷帘快门相机的模糊图像通用标定,进一步扩大方法的应用范围。

第四,构建端到端的通用标定全流程框架。本研究的框架已经实现了全可微的优化,未来可将去模糊、特征提取、相机位姿优化、通用模型标定整合到一个端到端的可微框架中,实现从模糊图像输入到通用相机模型输出的全流程端到端优化,进一步提升标定的精度与效率。

第五,实现无标定靶标的自然场景通用标定。本研究仍需依赖已知结构的标定靶标,未来可结合自然场景的特征与结构先验,将本框架扩展到无标定靶标的自然场景中,实现从任意自然场景的模糊图像中完成通用相机标定,彻底消除标定对专用靶标的依赖,让通用标定技术能够应用于更广泛的真实场景。

本文仅做学术分享,如有侵权,请联系删文。

3D视觉方向论文辅导来啦!可辅导SCI期刊、CCF会议、本硕博毕设、核心期刊等。

添加微信:cv3d001,备注:姓名+方向+单位,邀请入群。

http://www.jsqmd.com/news/476334/

相关文章:

  • 2026年广州地区彩钢瓦金属水性漆、玻璃钢水性漆厂家十大排名 - myqiye
  • 在 Windows 上生成本地 SSL 证书并使用 HTTPS 访问本地 Nginx 服务器
  • STM32G0系列高级定时器TIM1刹车中断配置与安全恢复机制实战(HAL库)
  • Verilog进阶:2001标准下模块端口的ANSI-C风格实践指南
  • 关注宝骏悦也plus充电枪,广州汽车销售公司哪家更靠谱 - mypinpai
  • 基于STM32F407与LVGL的立创开源拍立得:硬件设计、图像处理与低功耗实现
  • Windows11 CH340串口驱动版本回溯:从识别到打不开的深度排障
  • Go语言文件操作教程:如何读取、写入和管理文件
  • Spring_couplet_generation 与传统对联创作对比分析
  • CLIP-GmP-ViT-L-14多场景落地:已验证支持金融票据、司法卷宗、工业图纸等专业图像
  • 抖音直播高效下载解决方案:从痛点到全流程自动化指南
  • 【技术解析】Pipeline ADC中放大器增益为何必须为2的幂次方?
  • [算法训练] LeetCode Hot100 学习笔记#2
  • HUNYUAN-MT 7B翻译终端与Dify平台集成:构建无需代码的智能翻译工作流
  • Go语言连接 MySQL 教程:Golang 数据库操作入门
  • Python连接ClickHouse的实战避坑指南
  • GD32F450嵌入式环境监控系统设计与实现
  • Python flask 智慧旅游系统siiny4vh(车票,美食,酒店,门票,线路)
  • 科研绘图自动化:让学术图表创作效率提升十倍的智能解决方案
  • 跨平台文件路径处理:‘/‘与‘\‘的兼容性实践指南
  • u8g2与Adafruit_GFX实战:为嵌入式显示定制精简中文字库
  • 基于Soft-RoCE的RDMA开发环境搭建与调试实战
  • SUSTechPOINTS实战:从零部署3D点云标注平台,解锁自动驾驶数据标注新姿势
  • 国产MCU高精度μA级数字电流计设计
  • 实战指南:基于Multisim的压控电压源二阶带通滤波器设计与参数调优
  • 基于逻辑派FPGA-G1开发板的DHT11单总线温湿度传感器Verilog驱动实战
  • 基于TL082的非线性负阻抗电路设计与实测分析
  • YOLOv8剪枝实战:基于torch_pruning的轻量化模型优化(detect/segment双任务)
  • 效率倍增:基于快马平台快速生成openclaw飞书自动化通知机器人
  • 从像素到指标:手把手排查Landsat8 EVI计算中的异常值