当前位置：首页 > news >正文

【IJCV 2026 顶刊】最新研究：中国学者提出图像分割物理正则化损失函数，图像分割技术迎来“物理+AI”新范式！

news 2026/7/4 5:07:43

Physical Regularization Loss: Integrating Physical Knowledge to Image Segmentation

作者：Yan Ding（重庆邮电大学）, Shuang Li, Huafeng Li（昆明理工）, Guanqiu Qi（纽约州立大学）, Baisen Cong（重庆邮电大学）,Yunpeng Gong（厦门大学）, Zhiqin Zhu（重庆邮电大学）

发表于：International Journal of Computer Vision （IJCV）2026

论文链接：https://link.springer.com/article/10.1007/s11263-026-02776-5

当物理定律遇上深度学习，图像分割的“黑箱”被打开了！

在计算机视觉领域，图像分割一直是核心挑战之一——让机器像人类一样，精准识别图片中“哪里是人、哪里是车、哪里是病灶”。然而，传统深度学习方法虽然强大，却像是一个“黑箱”：依赖海量数据、泛化能力差、缺乏可解释性。

现在，来自重庆邮电大学、昆明理工大学、厦门大学等机构联合提出图像分割新范式，在《International Journal of Computer Vision》上发表了一项开创性研究，首次将物理规律直接嵌入图像分割模型的训练过程，提出了一种全新的物理正则化损失函数（PRL），让AI不仅“看得更准”，还能“想得更明白”！

痛点：数据驱动的“天花板”

当前的图像分割模型，如FCN、U-Net等，虽然在标准数据集上表现优异，但面临三大瓶颈：

数据饥饿：需要大量高质量标注数据，在医疗等稀缺数据场景下表现不佳；

泛化困难：模型在A数据集上训练，到B数据集上性能骤降；

缺乏解释：模型决策过程不透明，难以信任。

创新：给AI装上“物理引擎”

这项研究从经典的Perona-Malik（P-M）各向异性扩散方程中获得灵感。该方程原本用于图像处理中的边缘保持平滑，其核心思想是：在图像内部区域进行平滑去噪，在边缘处停止扩散，保留结构信息。

研究将这一物理过程改造成一个可微分的物理正则化损失函数，与传统的交叉熵、Dice等数据驱动损失共同训练模型。

三大突破：

物理约束融入训练
PRL强制模型的预测结果符合图像扩散的物理规律，相当于给AI装上了“物理常识”，在数据不足时依然能保持结构合理性。

快速数值算法
提出基于半像素差分的高效计算方法，显著降低物理损失的计算开销，训练效率提升约20%。

理论完备性
严格证明了改进后P-M方程弱解的存在性与唯一性，确保物理约束的数学稳定性。

一张图，道尽当前深度学习模型的无奈。图1以极具冲击力的视觉语言，揭示了图像分割领域挥之不去的三大阴影：
左边，模型像饥渴的巨兽，吞噬着海量标注数据，却在数据稀缺时瞬间失灵；
中间，它像水土不服的旅行者，在一个数据集上风光无限，换到另一个场景却迷失方向；
右边，它又像沉默的预言家，只给结果，从不解释——那深不可测的“黑箱”里，究竟藏着怎样的决策逻辑？
这正是困住AI走向高精尖应用的三大枷锁：数据依赖、泛化困难、缺乏可解释性。
图1不仅是一张示意图，更是一份向传统范式发出的战书：如果数据驱动已达天花板，我们该去向何方？

如果说图1是困境的呐喊，图3就是破局的答卷。这幅架构图勾勒出一场优雅的革命：
左侧，深度学习模块如常从图像中汲取特征；
右侧，一个名为PRL的全新模块悄然嵌入——它不是替代，而是赋能。传统的交叉熵、Dice损失依旧坚守阵地，但旁边多了一位“物理老师”：基于改进P-M方程的物理正则化损失，将现实世界的扩散定律翻译成机器能懂的语言，温柔而坚定地引导模型走向更合理的边界。最妙的是，这位“老师”只在训练时在场，推理阶段悄然隐退，不给部署增加一丝负担。

实验结果：全面提升，稳中有升

在五大公开数据集上进行了系统验证，涵盖城市街景（Cityscapes）、自然图像（Pascal VOC 2012）、皮肤病（ISIC 2017 & 2018）、脑肿瘤MRI（BraTS 2020）等多个任务。

部分亮点：
Cityscapes + PIDNet：mIoU从78.57%提升至79.24%

Pascal VOC + ResNet101：mIoU从78.32%提升至79.41%

ISIC 2017 + EGE-UNet：mIoU从79.81%提升至80.51%

BraTS 2020 + TransBTS：平均DSC提升0.34%，HD95降低2.18

更令人惊喜的是，在少样本学习实验中，当训练数据减少90%时，PRL仍能带来2%以上的性能提升，展现出极强的数据效率和泛化能力。

可视化：物理过程“看得见”

PRL最吸引人的一点是它的可解释性。研究者可视化出模型内部的扩散系数图：

这幅图，或许是整篇论文最令人印象深刻的画面。左侧，是一张普通的皮肤镜图像，毛发缠绕、病灶隐现；
中间，是PRL在训练过程中生成的扩散系数图——它像一张“热力图”，为AI的每一个决策标上了物理注脚。红色区域如火焰般跃动（扩散强），意味着模型正在主动平滑皮肤纹理、压制毛发噪声，这是“主动去噪”的物理证据；蓝色区域如冰川般凝固（扩散弱），模型精准识别出病灶边缘，果断停止扩散、严保结构。
右侧，是最终的分割结果。图11向世界宣告：AI不再是只会给答案的黑箱，它的每一个判断、每一次犹豫，都被物理定律翻译成了人类能读懂的色彩。这意味着当医生凝视这张图，看到的是是可理解的决策逻辑——这便是是可解释AI的进步。