当前位置：首页 > news >正文

【东南大学-朱鹏飞组-ICML25】用于退化的多模态图像融合的任务门控多专家协作网络

news 2026/7/8 18:06:28

文章：Task-Gated Multi-Expert Collaboration Network for Degraded Multi-Modal Image Fusion

代码：https://github.com/LeeX54946/TG-ECNet

单位：东南大学

一、问题背景

多模态图像融合是安防监控、应急救援等场景的核心支撑技术，通过融合可见光与红外图像的互补信息，能显著提升复杂环境下的视觉感知能力。但实际应用中，成像设备易受外界干扰：

可见光图像常面临噪声、模糊、雾霭等混合退化；
红外图像因传感器特性，易产生明暗交替的条纹噪声；
传统“先修复后融合”方案成本高、信息损耗大，现有一体化模型应对复杂退化能力不足，导致融合图像质量差、下游任务鲁棒性低。

二、方法创新

针对上述痛点，研究团队提出任务门控多专家协作网络（TG-ECNet），以“一体化框架+智能适配”思路实现退化图像的修复与融合，核心创新包括三点：

1. 统一任务框架

首次将多模态图像修复与融合任务整合到单一端到端模型中，避免传统串联方案的信息断裂问题，实现“一次输入、双重优化”的高效处理。

2. 任务感知门控与多专家协作

退化感知门控：自动识别输入图像的退化类型（噪声、模糊、条纹等），动态选择最优专家组进行针对性修复；
融合感知门控：通过多专家协作，智能权衡不同模态的特征贡献，精准聚合互补信息，兼顾修复效果与融合质量。

3. 两阶段训练策略

第一阶段：聚焦修复任务，优化模型对各类退化的处理能力；
第二阶段：专注融合任务，在不干扰修复效果的前提下，提升多模态特征整合精度，实现双任务的平衡优化。

4. 大规模基准数据集

构建含3万余组数据的DeMMI-RF数据集，覆盖6种退化类型（高/中/低高斯噪声、雾霭、散焦模糊、条纹噪声），包含无人机、驾驶等多视角场景，为相关研究提供可靠基准。

三、实验结果

在DeMMI-RF和EMS两大数据集上，TG-ECNet全面超越DRMF、Text-IF等主流模型，表现亮眼：

1. 定量指标领先

在CC（相关性）、PSNR（峰值信噪比）、MS-SSIM（结构相似度）等核心指标上均排名第一，其中PSNR达30.58，显著高于传统模型的29.5左右，说明图像质量与结构完整性更优。

2. 复杂场景表现突出

极端噪声场景：能有效降噪并保留细节，而其他模型易出现模糊或噪声残留；
雾霭+模糊混合退化：平衡去雾与去模糊效果，避免颜色失真；
红外条纹噪声：精准抑制条纹同时，完整保留热目标信息，融合图像更清晰自然。

3. 下游任务鲁棒性强

将融合结果输入YOLOv5（目标检测）和Grounded-SAM（分割）模型，mAP50达0.969，分割准确率显著优于其他方法，能精准识别目标轮廓，避免误分、漏分。

四、优势与局限

核心优势

适配性强：无需提前定义退化类型，自动适配多种单一及混合退化场景；
效率更高：端到端框架减少中间环节，模型参数160.86M，兼顾性能与部署可行性；
实用性广：覆盖无人机、驾驶等多视角数据，适配安防、救援等实际应用场景。

现存局限

模型对超极端混合退化（如强噪声+厚雾+重度模糊）的处理效果仍有提升空间；
相比部分轻量模型，推理速度虽满足实用需求，但在实时性要求极高的场景（如高速移动目标监控）需进一步优化。

五、一句话总结

TG-ECNet通过任务门控与多专家协作机制，构建了退化多模态图像修复与融合的一体化框架，在复杂场景下实现了融合质量与下游任务鲁棒性的双重突破，为安防、救援等领域的高可靠视觉感知提供了新方案。

查看全文

http://www.jsqmd.com/news/168452/

Miniconda-Python3.10镜像中设置ulimit提升文件句柄数

Miniconda-Python3.10镜像支持文本分类任务的端到端流程

Miniconda-Python3.10镜像在边缘计算设备上的轻量化部署

Miniconda-Python3.10镜像中运行Flask Web服务的示例代码

Miniconda-Python3.10镜像支持视频内容理解的预处理流程

Miniconda-Python3.10镜像在智能家居控制系统中的嵌入

Miniconda-Python3.10镜像中使用ncdu分析磁盘占用

【TextIn大模型加速器 + 火山引擎】让AI读懂财报：30分钟搭建企业级金融分析Agent

Miniconda-Python3.10镜像支持低代码平台后端逻辑扩展

Miniconda+PyTorch+GPU：构建高性能AI算力环境的技术路径

Miniconda-Python3.10镜像在舆情监测系统中的关键技术

掌握Vivado固化程序烧写：Flash操作核心要点

从零开始搭建深度学习环境：基于Miniconda-Python3.11的完整指南

工业控制项目中IAR软件安装实战案例

为什么你的小说总是烂尾？揭秘资深作者都在用的“沉浸式写作法”与提高写作效率的神器

Miniconda-Python3.10镜像中配置auditd审计系统操作

Windows下Anaconda vs Miniconda配置PyTorch环境对比详解

Miniconda-Python3.10镜像中配置代理访问外网资源

实测10款降AI率工具：2025年5个有效方法指南！帮你免费降低AI率，论文降AIGC不再头疼！

AUTOSAR 学习效率翻倍：我如何把 CP/AP 规范重构成认知地图

基于proteus8.17下载及安装的实验课操作指南

Miniconda-Python3.10镜像结合Grafana可视化资源消耗

从堆栈分析入手：HardFault_Handler问题定位完整指南

2025年论文降ai全攻略：这5款免费降ai率工具亲测有效，帮你快速降低ai率，拯救AIGC爆表！

利用hbuilderx制作网页创建多页面学习导航站

Miniconda-Python3.10镜像支持元宇宙场景建模的数据处理

在云服务器上部署Miniconda-Python3.11并运行PyTorch训练任务

2025年降AI率实战：亲测5款免费降ai率工具，拯救你的AIGC飘红论文！

linux软件-screen(防止因网络断开导致计算中断)