当前位置: 首页 > news >正文

YOLO26改进 - 特征融合 重参数化CSPELAN模块(Reparameterized CSPELAN Module)通过结构重参数化实现高效特征提取

前言

本文介绍了可编程梯度信息(PGI)和通用高效层聚合网络(GELAN)及其在 YOLO26中的结合。现有深度学习方法忽略了数据经深度网络传输时的信息丢失问题,为此提出 PGI 概念,它能为目标任务提供完整输入信息以计算目标函数,获取可靠梯度信息更新网络权重;还基于梯度路径规划设计了轻量级网络架构 GELAN。我们将核心模块 RepNCSPELAN4 集成进 YOLO26,替换部分模块。在 MS COCO 数据集目标检测任务中验证,结果显示 GELAN 参数利用率高,PGI 使模型表现更优。

文章目录: YOLO26改进大全:卷积层、轻量化、注意力机制、损失函数、Backbone、SPPF、Neck、检测头全方位优化汇总

专栏链接: YOLO26改进专栏

@

目录
  • 前言
  • 介绍
    • 摘要
  • 文章链接
  • 核心代码
  • 实验
    • 脚本
    • 结果

介绍

image-20241125215032897

摘要

当前的深度学习方法主要关注如何设计最合适的目标函数,以使模型的预测结果尽可能接近真实值(ground truth)。同时,还需要设计一种适当的架构,以便为预测获取足够的信息。然而,现有方法忽略了一个事实:当输入数据经过逐层的特征提取和空间变换时,大量信息会丢失。本文将深入探讨数据通过深度网络传输时发生的数据丢失这一重要问题,即信息瓶颈和可逆函数。

我们提出了可编程梯度信息(Programmable Gradient Information, PGI)的概念,用以应对深度网络为实现多目标所需的各种变化。PGI能够为目标任务提供完整的输入信息来计算目标函数,从而获得可靠的梯度信息,用于更新网络权重。此外,我们基于梯度路径规划设计了一种新的轻量级网络架构——通用高效层聚合网络(Generalized Efficient Layer Aggregation Network, GELAN)。GELAN的架构验证了PGI在轻量级模型中取得了卓越的结果。

我们在MS COCO数据集上的目标检测任务中验证了所提出的GELAN和PGI。结果表明,GELAN仅使用常规卷积算子就能比基于深度卷积(depth-wise convolution)开发的最新方法实现更好的参数利用率。PGI适用于从轻量级到大型的多种模型,能够获取完整的信息,使从零训练的模型比使用大规模数据集预训练的最新模型表现更优,具体对比结果见图1。

源码已开源,详见:https://github.com/WongKinYiu/yolov9。

文章链接

论文地址:论文地址

代码地址:代码地址

核心代码

class RepNCSPELAN4(nn.Module):# csp-elandef __init__(self, c1, c2, c3, c4, c5=1):  # ch_in, ch_out, number, shortcut, groups, expansionsuper().__init__()self.c = c3//2self.cv1 = Conv(c1, c3, 1, 1)self.cv2 = nn.Sequential(RepNCSP(c3//2, c4, c5), Conv(c4, c4, 3, 1))self.cv3 = nn.Sequential(RepNCSP(c4, c4, c5), Conv(c4, c4, 3, 1))self.cv4 = Conv(c3+(2*c4), c2, 1, 1)def forward(self, x):y = list(self.cv1(x).chunk(2, 1))y.extend((m(y[-1])) for m in [self.cv2, self.cv3])return self.cv4(torch.cat(y, 1))def forward_split(self, x):y = list(self.cv1(x).split((self.c, self.c), 1))y.extend(m(y[-1]) for m in [self.cv2, self.cv3])return self.cv4(torch.cat(y, 1))

实验

脚本

import warnings
warnings.filterwarnings('ignore')
from ultralytics import YOLOif __name__ == '__main__':
#     修改为自己的配置文件地址model = YOLO('./ultralytics/cfg/models/26/yolo26-RepNCSPELAN4.yaml')
#     修改为自己的数据集地址model.train(data='./ultralytics/cfg/datasets/coco8.yaml',cache=False,imgsz=640,epochs=10,single_cls=False,  # 是否是单类别检测batch=8,close_mosaic=10,workers=0,optimizer='MuSGD',  # optimizer='SGD',amp=False,project='runs/train',name='yolo26-RepNCSPELAN4',)

结果

image-20260125191320610

http://www.jsqmd.com/news/347299/

相关文章:

  • java+vue+springboot慈溪市猫咪宠物网王飞---
  • java+vue+springboot打车拼车系统-杨富祥
  • YOLO26改进 - 采样 ICCV 顶会技术:WaveletPool 小波池化强化采样,保留小目标细节
  • YOLO26改进 - 特征融合 融合Hyper-YOLO混合聚合网络MANet(Mixed Aggregation Network)通过多路径设计实现高效特征学习与模型适应性提升
  • YOLO26改进 - 注意力机制 多扩张通道细化器MDCR 通过通道划分与异构扩张卷积提升小目标定位能力
  • YOLO26改进 - 注意力机制 HAT混合注意力变换器:超分重建能力迁移,提升小目标特征清晰度与检测精度
  • YOLO26改进 - 卷积Conv 融合Diverse Branch Block (DBB) 多样分支块的多尺度卷积路径,丰富特征空间实现即插即用性能增益
  • AI原生应用领域可解释性:助力企业数字化转型
  • YOLO26改进 - 注意力机制 双层路由注意力BRA(Bi-Level Routing Attention)增强小目标特征捕获
  • 基于机器学习的A_B测试结果预测模型构建
  • 基于Matlab的直流电机转速电流PI双闭环控制matlab仿真模型(仿真+设计文档+参考文献)
  • Excel倍数进位大师CEILING函数:从时间计费到物流计重的智能舍入方案
  • YOLO26改进 - 卷积Conv 融合MogaNet中的ChannelAggregationFFN(通道聚合前馈网络),优化通道维度的特征
  • 大数据时代半结构化数据的存储性能优化
  • 基于非洲秃鹫优化算法的图像分割附Matlab代码
  • YOLO26改进 - 卷积Conv SAConv可切换空洞卷积:自适应融合多尺度特征,优化小目标与遮挡目标感知
  • YOLO26改进 - 卷积Conv _ 引入线性可变形卷积LDConv(Linear Deformable Convolution)增强不规则目标特征捕获能力
  • 开题报告qq信管黄莹
  • Flink Watermark机制:解决大数据流处理中的乱序问题
  • YOLO26改进 - 注意力机制 Deformable-LKA 可变形大核注意力:自适应采样网格优化特征捕捉,提升不规则目标感知
  • YOLO26改进 - 卷积Conv SCConv空间和通道重建卷积:轻量化设计助力复杂场景与小目标检测
  • 揭秘国家级卫星超级工厂!年产能150颗、产值破500亿的商业航天“新质生产力“范本(WORD)
  • 【无人机路径规划】无人机结构巡检飞行规划系统,核心用于针对已知三维结构(通过 STL 文件导入)完成无人机观测点生成、路径优化(基于 TSP 问题)、能耗分析、重叠率分析及轨迹可视化附Matlab代码
  • YOLO26改进 - 卷积Conv SPD-Conv空间深度转换卷积优化空间信息编码,攻克小目标检测难题
  • 实现ai循环中插入用户对话的方法
  • 【DVMCNN诊断网络】基于离散韦格纳分布DWVD结合MCNN多尺度卷积神经网络的故障诊断研究附matlab代码
  • YOLO26改进 - 卷积Conv 加权卷积wConv2D:无损替换标准卷积,增强空间建模与特征提取质量 arXiv 2025
  • YOLO26涨点改进 | 独家创新、Neck特征融合改进篇 | ICLR 2025 | 引入FMoM频率调制融合模块,实现空间与频率的协同特征增强,助力多模态融合、小目标检测、遥感目标检测有效涨点
  • 【AAAI 2026即插即用】Mamba模块篇 | MUB曼巴上采样模块,特别适用于图像恢复、图像超分辨率、图像恢复、暗光增强、遥感任务、目标检测、图像分割 和 医学影像分析等CV任务通用,涨点起飞
  • YOLO26改进 - 卷积Conv 注入多阶门控聚合机制:Multi-Order Gated Aggregation 突破表示瓶颈,增强复杂场景目标感知能力