当前位置: 首页 > news >正文

YOLO26改进 - 卷积Conv 加权卷积wConv2D:无损替换标准卷积,增强空间建模与特征提取质量 arXiv 2025

# 前言

本文介绍了加权卷积wConv及其在YOLO26中的结合。加权卷积是一种新型卷积机制,通过引入密度函数,根据邻域像素与中心像素的距离自适应调整权重,打破传统卷积等权处理的局限。它在不增加可训练参数的情况下实现“距离感知”特征提取,通过哈达玛积将密度函数与卷积核结合。其优化框架采用双优化器,分别对卷积核权重和密度函数进行优化。我们将加权卷积集成进YOLO26,实验表明,与标准卷积相比,加权卷积能显著降低损失、提高测试准确率。

文章目录: YOLO26改进大全:卷积层、轻量化、注意力机制、损失函数、Backbone、SPPF、Neck、检测头全方位优化汇总

专栏链接: YOLO26改进专栏

@

目录
  • 介绍
    • 摘要
  • 文章链接
  • 基本原理
    • 一、加权卷积定义与原理
    • 二、数学表达与密度函数设计
      • 1. 数学形式
      • 2. 密度函数 Φ 的结构设计
    • 三、优化框架:参数与密度函数分离优化
  • 核心代码
  • 实验
    • 脚本
    • 结果

介绍

image-20251123220542572

摘要

本文提出了加权卷积(weighted convolution) 这一新型卷积方法,适用于定义在规则网格上的信号(如二维图像)。该方法通过引入最优密度函数(optimal density function) ,根据邻域像素与中心像素的距离,对邻域像素的贡献度进行动态缩放。这一设计与传统的均匀卷积(uniform convolution) 不同——后者对所有邻域像素赋予同等权重。 我们提出的加权卷积可应用于卷积神经网络(CNN)相关任务,以提升模型的逼近精度。针对给定的卷积网络,本文设计了一套基于极小化模型的框架来求解最优密度函数,该框架将卷积核权重的优化(采用随机梯度下降法)与密度函数的优化(采用DIRECT-L算法)分离开来。 在图像到图像任务(如图像去噪)的学习模型上进行的实验表明,与标准卷积相比,加权卷积显著降低了损失(最高可达53%的降幅),同时提高了测试准确率。尽管该方法会使执行时间增加11%,但它对学习模型的多个超参数具有良好的鲁棒性。未来的研究将把加权卷积应用于实际场景中的二维和三维图像卷积学习任务。

文章链接

论文地址:论文地址

代码地址:代码地址

基本原理


一、加权卷积定义与原理

加权卷积(Weighted Convolution)是一种新型的卷积机制,旨在增强对局部空间相关性的建模能力。其核心思想是在卷积操作中引入密度函数 Φ(Density Function),用于根据邻域像素与中心像素的空间距离自适应地调整权重,从而打破传统卷积对所有邻域像素“等权”处理的假设【10†source】。

该方法通过对密度函数进行独立优化,在不增加模型可训练参数的前提下实现“距离感知”的特征提取。加权卷积的数学实现为将密度函数Φ与卷积核进行哈达玛积(Hadamard product),并应用于像素邻域。


二、数学表达与密度函数设计

1. 数学形式

表达形式 公式 说明
连续 $(f * g_{\varphi})(t) = \int f(\tau) \cdot \varphi(t - \tau) g(t - \tau) d\tau$ 密度函数 $\varphi$ 体现“距离敏感”卷积
离散 $(I * W_{\Phi})^f_{ij} = \sum_{a,b} (\Phi_{ab} w^f_{ab}) \cdot I_{i+a,j+b}$ $\Phi$ 为密度矩阵
矩阵 $(I * W_{\Phi})^f_{ij} = \langle \Phi \circ w^f, N(I_{ij}) \rangle_F$ $\circ$ 表哈达玛积,$N(I_{ij})$ 为邻域矩阵

特殊情况:当 Φ 为常数矩阵(如全1),该加权卷积退化为标准卷积。


2. 密度函数 Φ 的结构设计

为了降低优化复杂度,密度函数被约束为:

  • 对称性:Φ 的生成向量 α 满足 α = α[::-1],即关于中心轴对称;
  • 秩为1的结构:Φ = ααᵗ,降低变量数从 $K^2$ 到 $(K-1)/2$;
  • 中心像素权重固定为1:即 αₘ = 1(m 为中心索引);
  • 变量约束范围:α 分量在 $[0, 2]$ 内搜索。

三、优化框架:参数与密度函数分离优化

为避免优化冲突,设计了双优化器:

对象 优化方法 特性
卷积核权重 $w$ SGD 可导、梯度下降、使用 Kaiming 初始化
密度函数参数 $\alpha$ DIRECT-L 无导数、全局优化、支持非凸问题

核心代码

class wConv2d(nn.Module):def __init__(self, in_channels, out_channels, kernel_size, den, stride=1, padding=1, groups=1, dilation=1, bias=False):super(wConv2d, self).__init__()       self.stride = _pair(stride)self.padding = _pair(padding)self.kernel_size = _pair(kernel_size)self.groups = groupsself.dilation = _pair(dilation)      self.weight = nn.Parameter(torch.empty(out_channels, in_channels // groups, *self.kernel_size))nn.init.kaiming_normal_(self.weight, mode='fan_out', nonlinearity='relu')        self.bias = nn.Parameter(torch.zeros(out_channels)) if bias else Nonedevice = torch.device('cpu')  self.register_buffer('alfa', torch.cat([torch.tensor(den, device=device),torch.tensor([1.0], device=device),torch.flip(torch.tensor(den, device=device), dims=[0])]))self.register_buffer('Phi', torch.outer(self.alfa, self.alfa))if self.Phi.shape != self.kernel_size:raise ValueError(f"Phi shape {self.Phi.shape} must match kernel size {self.kernel_size}")def forward(self, x):Phi = self.Phi.to(x.device)weight_Phi = self.weight * Phireturn F.conv2d(x, weight_Phi, bias=self.bias, stride=self.stride, padding=self.padding, groups=self.groups, dilation=self.dilation)

实验

脚本

import warnings
warnings.filterwarnings('ignore')
from ultralytics import YOLOif __name__ == '__main__':
#     修改为自己的配置文件地址model = YOLO('./ultralytics/cfg/models/26/yolo26-wConv2d.yaml')
#     修改为自己的数据集地址model.train(data='./ultralytics/cfg/datasets/coco8.yaml',cache=False,imgsz=640,epochs=10,single_cls=False,  # 是否是单类别检测batch=8,close_mosaic=10,workers=0,optimizer='MuSGD',amp=True,project='runs/train',name='yolo26-wConv2d',)

结果

image-20260117140413137

http://www.jsqmd.com/news/347272/

相关文章:

  • YOLO26涨点改进 | 独家创新、Neck特征融合改进篇 | ICLR 2025 | 引入FMoM频率调制融合模块,实现空间与频率的协同特征增强,助力多模态融合、小目标检测、遥感目标检测有效涨点
  • 【AAAI 2026即插即用】Mamba模块篇 | MUB曼巴上采样模块,特别适用于图像恢复、图像超分辨率、图像恢复、暗光增强、遥感任务、目标检测、图像分割 和 医学影像分析等CV任务通用,涨点起飞
  • YOLO26改进 - 卷积Conv 注入多阶门控聚合机制:Multi-Order Gated Aggregation 突破表示瓶颈,增强复杂场景目标感知能力
  • 沙丘猫算法+哈里斯鹰+鲸鱼+黏菌算法+蝴蝶算法优化ELMAN神经网络回归预测附Matlab代码
  • 开题报告vb酒店客房部
  • 【无人机三维路径规划】基于启发式算法的无人机三维路径规划动态避障算法附Matlab代码
  • 拼多多商家端 anti-content 分析
  • 开题报告【因泰魔锋商城的设计与实现】
  • 【DVRN故障诊断】基于离散韦格纳分布DWVD结合卷积神经网络(CNN)和残差网络(ResNet)的故障诊断研究附Matlab代码
  • 一文讲透 LLM、RAG、MCP 与 AI Agent:AI 系统的四个核心层级
  • YOLO26改进 - 卷积Conv DualConv( Dual Convolutional):用于轻量级深度神经网络的双卷积核
  • 从零构建 MCP Server:协议原理 + 完整实战
  • MySQL数据库讲解,如何使用聚合函数方法?
  • YOLO26改进 - C3k2 C3k2 融合 LSConv (Large-Small Conv)融合大核感知与小核聚合,提升小目标特征判别力
  • YOLO26改进 - 卷积Conv GCNet之金箍棒块GCBlock : 重参数化捕获全局依赖 CVPR 2025
  • 从蜜蜂导航到无人机自主飞行:基于ZYNQ的仿生偏振导航系统全解析
  • MySQL 逻辑备份 vs 物理备份:区别与生产级实战指南
  • target_include_directories对比 PUBLIC / PRIVATE
  • YOLO26改进 - 卷积Conv LAE 轻量级自适应提取卷积,从多尺度特征图中获得更多的上下文信息和高分辨率细节
  • CMake制作动态库与静态库对比
  • YOLO26改进 - 卷积Conv MKDC 多核深度卷积块:多分支架构协同捕获局部细节与全局语义,提升特征判别力 ICCV 2025
  • YOLO26改进 - 卷积Conv 增强感受野与多尺度特征捕获:引入RFB感受野块(Receptive Field Block)多分支卷积结构
  • SW草图绘制之倒角和圆角
  • YOLO26改进 - SPPF模块 替代SPPF, Mona多认知视觉适配器(CVPR 2025):打破全参数微调的性能枷锁:即插即用的提点神器
  • YOLO26改进 - SPPF模块 SPPELAN 空间金字塔池化与增强局部注意力:替代SPPF增强多尺度上下文捕获,提升检测精度
  • YOLO26改进 - 卷积Conv 融合多阶门控聚合网络MogaNet与 CA block,提升复杂场景与小目标检测鲁棒性
  • YOLO26改进 - 卷积Conv 即插即用轻量化突破:OREPA在线卷积重参数化,通过动态结构演化实现高效特征提取与自适应优化
  • YOLO26改进 - SPPF模块 替代SPPF,FFocal Modulation焦点调制:即插即用轻量设计优化全局语义捕获
  • YOLO26改进 - SPPF模块 发论文神器!LSKA注意力改进SPPF,增强多尺度特征提取能力,高效涨点!!!
  • 钣金件化学池视觉跟踪系统方案