当前位置：首页 > news >正文

YOLO26改进 - 特征融合重参数化CSPELAN模块（Reparameterized CSPELAN Module）通过结构重参数化实现高效特征提取

news 2026/7/8 4:45:00

前言

本文介绍了可编程梯度信息（PGI）和通用高效层聚合网络（GELAN）及其在 YOLO26中的结合。现有深度学习方法忽略了数据经深度网络传输时的信息丢失问题，为此提出 PGI 概念，它能为目标任务提供完整输入信息以计算目标函数，获取可靠梯度信息更新网络权重；还基于梯度路径规划设计了轻量级网络架构 GELAN。我们将核心模块 RepNCSPELAN4 集成进 YOLO26，替换部分模块。在 MS COCO 数据集目标检测任务中验证，结果显示 GELAN 参数利用率高，PGI 使模型表现更优。

文章目录： YOLO26改进大全：卷积层、轻量化、注意力机制、损失函数、Backbone、SPPF、Neck、检测头全方位优化汇总

专栏链接: YOLO26改进专栏

前言
介绍
- 摘要
文章链接
核心代码
实验
- 脚本
- 结果

介绍

摘要

当前的深度学习方法主要关注如何设计最合适的目标函数，以使模型的预测结果尽可能接近真实值（ground truth）。同时，还需要设计一种适当的架构，以便为预测获取足够的信息。然而，现有方法忽略了一个事实：当输入数据经过逐层的特征提取和空间变换时，大量信息会丢失。本文将深入探讨数据通过深度网络传输时发生的数据丢失这一重要问题，即信息瓶颈和可逆函数。

我们提出了可编程梯度信息（Programmable Gradient Information, PGI）的概念，用以应对深度网络为实现多目标所需的各种变化。PGI能够为目标任务提供完整的输入信息来计算目标函数，从而获得可靠的梯度信息，用于更新网络权重。此外，我们基于梯度路径规划设计了一种新的轻量级网络架构——通用高效层聚合网络（Generalized Efficient Layer Aggregation Network, GELAN）。GELAN的架构验证了PGI在轻量级模型中取得了卓越的结果。

我们在MS COCO数据集上的目标检测任务中验证了所提出的GELAN和PGI。结果表明，GELAN仅使用常规卷积算子就能比基于深度卷积（depth-wise convolution）开发的最新方法实现更好的参数利用率。PGI适用于从轻量级到大型的多种模型，能够获取完整的信息，使从零训练的模型比使用大规模数据集预训练的最新模型表现更优，具体对比结果见图1。

源码已开源，详见：https://github.com/WongKinYiu/yolov9。

文章链接

论文地址：论文地址

代码地址：代码地址

核心代码

class RepNCSPELAN4(nn.Module):# csp-elandef __init__(self, c1, c2, c3, c4, c5=1):  # ch_in, ch_out, number, shortcut, groups, expansionsuper().__init__()self.c = c3//2self.cv1 = Conv(c1, c3, 1, 1)self.cv2 = nn.Sequential(RepNCSP(c3//2, c4, c5), Conv(c4, c4, 3, 1))self.cv3 = nn.Sequential(RepNCSP(c4, c4, c5), Conv(c4, c4, 3, 1))self.cv4 = Conv(c3+(2*c4), c2, 1, 1)def forward(self, x):y = list(self.cv1(x).chunk(2, 1))y.extend((m(y[-1])) for m in [self.cv2, self.cv3])return self.cv4(torch.cat(y, 1))def forward_split(self, x):y = list(self.cv1(x).split((self.c, self.c), 1))y.extend(m(y[-1]) for m in [self.cv2, self.cv3])return self.cv4(torch.cat(y, 1))

实验

脚本

import warnings
warnings.filterwarnings('ignore')
from ultralytics import YOLOif __name__ == '__main__':
#     修改为自己的配置文件地址model = YOLO('./ultralytics/cfg/models/26/yolo26-RepNCSPELAN4.yaml')
#     修改为自己的数据集地址model.train(data='./ultralytics/cfg/datasets/coco8.yaml',cache=False,imgsz=640,epochs=10,single_cls=False,  # 是否是单类别检测batch=8,close_mosaic=10,workers=0,optimizer='MuSGD',  # optimizer='SGD',amp=False,project='runs/train',name='yolo26-RepNCSPELAN4',)