当前位置: 首页 > news >正文

YOLO26改进12:SPPF-LSKA:注意力机制改进SPPF,增强多尺度特征提取能力

论文介绍

摘要

视觉注意力网络(VAN)中的大核注意力(LKA)模块已被证明在一系列视觉任务中表现出卓越性能,甚至超越视觉变换器(ViTs)。然而,LKA模块中的深度卷积层在卷积核尺寸增大时,计算量和内存占用呈二次方增长。为缓解这一问题,并支持在VAN的注意力模块中使用极大卷积核,本文提出了一种大分离核注意力模块(LSKA)。LSKA将深度卷积层的二维卷积核分解为级联的水平与垂直一维核。相比标准LKA设计,该分解方法可直接在注意力模块中使用大核深度卷积层,无需额外模块。
实验表明,VAN中提出的LSKA模块在性能上与标准LKA模块相当,同时降低了计算复杂度和内存占用。研究还发现,随着核尺寸增大,LSKA设计使VAN更倾向于关注物体形状而非纹理。此外,本文首次在ImageNet的五种损坏版本数据集上系统评估了VAN中的LKA与LSKA、ViTs及近期ConvNeXt的鲁棒性。
大量实验结果表明,随着核尺寸增大,VAN中的LSKA模块显著降低了计算复杂度和内存占用,同时在物体识别、检测、语义分割及鲁棒性测试中优于ViTs和ConvNeXt,并与VAN中的LKA模块性能相当。

文章地址:论文地址

http://www.jsqmd.com/news/327203/

相关文章:

  • 深入研究:AI应用架构师的AI模型分布式部署研究成果
  • 解锁多路GMSL摄像头输入,基于瑞芯微RK3576的触觉智能硬件方案
  • Flink数据倾斜解决方案:大数据处理的常见难题
  • Claude Code 完整学习计划
  • FA_融合和滤波(FF,fusion_and_filter)-PT滤波器
  • 第 1 章:认识 Claude Code
  • 完整教程:边缘计算:K3s 轻量级 K8s 部署实践
  • /go/src/github.com/samber/lo 切片转MAP
  • 图的遍历/存储
  • wchar_t与_T()
  • WideCharToMultiByte与T2A
  • springboot基于微信小程序的扶贫助农系统及其小程序的实现_3pi4tt74_zl003
  • 基于微信小程序的精致护肤购物系统的设计与实现_r9xwp2r9
  • 基于图像识别的智能垃圾分类系统设计与实现_jew30c27_xk054
  • 豆包“炒股”翻车,程序员该为AI的“幻觉”背锅吗?
  • 高并发图书下载服务架构实践:小哈图书下载中心
  • AI 时代,我们是在进化还是在“脑力外包”?
  • 基于微信小程序的咖啡店点餐系统_56v41c6q
  • 2026成都GEO优化公司排名专业测评,专注本地化AI优化
  • 高效进阶不踩坑!静流书站(windowsfront.com)承包程序员全阶段学习资源
  • CCF-GESP 等级考试 2025年3月认证C++一级真题解析 - 指南
  • 基于SSM的种子商店网站的设计与开发_ci5gjw6e_zl067
  • 基于SSM的生产设备信息管理系统的设计与实现_l1fn0xee_jz056
  • 寒假7
  • Steam土豆兄弟游戏开发学习案例记录——Unity
  • Flutter for HarmonyOS 图书管理系统登录注册:Provider状态管理+自定义Widget,打造高效用户入口
  • 河北省旅游网站(11852)
  • 沃尔玛购物卡回收时这些关键点需牢记
  • 基于ssm的社区外来务工人员管理系统_10vz9c0a_jz119
  • VGGT:视觉几何接地变压器 - MKT