当前位置: 首页 > news >正文

【UNet 改进 | 注意机制篇】UNet引入LSKA注意力机制(2024 WACV),二次创新

本文教的是方法,也给出几种改进方法,二次创新结构,百变不离其宗一文带你改进自己模型,科研路上少走弯路。


前言

在医学图像分割任务中,病灶区域往往形态各异、边界模糊,且经常与周围组织的对比度较低,这要求模型具备极强的特征提取和细节辨别能力。传统的U-Net网络虽然通过跳跃连接融合了多尺度特征,但在处理复杂语义和精细边缘时仍有不足,尤其是在捕获长距离依赖关系时常常力不从心。为了解决这些痛点,本文引入了在计算机视觉领域表现出色的 LSKA(Large Separable Kernel Attention,大核可分离注意力)机制。LSKA 巧妙地将大尺寸的二维卷积核分解为空间维度上的水平和垂直一维卷积,结合深度可分离卷积,以极低的计算和内存开销实现了超大的感受野。这种创新设计不仅使得网络能够捕捉到长程的全局上下文信息,还在保留特征细节上表现卓越,让 U-Net 模型在医学图像病灶分割上取得显著突破!

论文发表信息

  • 论文标题Large Separable Kernel Attention: Rethinking the Large Kernel Attention Design in CNN
  • 发表会议/期刊WACV 2024 / Expert Systems with Applications
  • 核心贡献:提出了一种大核可分离注意力(LSKA)模块,通过将深度大卷积核分解为级联的水平和垂直一维卷积,有效减少了标准大核注意力(LKA)带来的巨大计算量和内存占用,实现了更高效的长程依赖捕获。
  • 论文地址:https://arxiv.org/abs/2309.01439
  • 代码地址:https://github.com/StevenLauHKHK/Large-Separable-Kernel-Attention

LSKA 核心模块理论

LSKA(大核可分离注意力)机制的核心思想在于在 CNN 中实现类似 Transformer 的大感受野,同时规避高昂的计算代价。传统的 LKA(大核注意力)在处理极大尺寸的卷积核时会消耗极高的计算资源。而 LSKA 则通过以下创新实现破局:

  1. 大核分解策略:LSKA 将原始的二维大卷积核(例如 23×23 或更大)分解为两个一维卷积(如 1×23 和 23×1)以及相应的空间扩张卷积。这一拆分大幅度降低了参数量和浮点运算次数。
  2. 长程依赖与自适应融合:在分别获取水平方向和垂直方向的宽泛上下文后,LSKA 将这些大感受野特征与局部特征进行注意力加权融合。它既保留了 CNN 处理局部纹理的优势,又获得了超越传统感受野的全局视野。

作为一个轻量化且高效的大核注意力模块,LSKA 能够让模型在不增加额外负担的情况下,深度挖掘长距离的组织关联特征,非常适合应用于复杂的医学图像分割。

训练代码参考和下载:手把手带你完成基于Unet的医学图像分割系统设计与实现,Unet网络架构讲解,Unet复现,使用vibe coding工具,开发一个完整系统,包含完整源码


文章目录

  • 前言
  • 论文发表信息
  • LSKA 核心模块理论
  • 🐴一、实战细节
    • ⚡⚡实验结果画图
    • ⚡⚡LSKA模块代码
    • ⚡⚡使用教程
      • ☑️步骤1
      • ☑️步骤2
      • ☑️步骤3
      • ☑️步骤4
  • 🐴二、模型结构分析
    • ⚡⚡ 注意机制结构分析
    • ⚡⚡二次创新实战
      • ☑️第一种改进手法
        • 📐模块的传参分析教程
  • 🐴三、论文常用的评估指标
      • ☑️像素准确率 (Pixel Accuracy, PA)
      • ☑️精确率 (Precision) 与 召回率 (Recall)
      • ☑️交并比 (Intersection over Union, IoU)
      • ☑️平均交并比 (Mean Intersection over Union, mIoU)
      • ☑️Dice系数 (Dice Coefficient / F1 Score)
  • 总结

🐴一、实战细节

⚡⚡实验结果画图

画图效果如下,代码可一键运行

画图代码:

# -*- coding: utf-8 -*-""" @Auth :落花不写码 @File :画图.py @IDE :PyCharm @Motto :学习新思想,争做新青年 """importmatplotlib.pyplotaspltimportpandasaspdimportos plt.rcParams
http://www.jsqmd.com/news/753070/

相关文章:

  • KeymouseGo完整指南:3分钟掌握鼠标键盘自动化,快速解放双手的免费方案
  • 从脚本自动化到专业开发:AutoHotkey V2扩展工具集的完整解决方案
  • QubitStateVector类内存泄漏暴雷事件(附NASA JPL验证通过的零拷贝量子态管理方案)
  • Nigate:让Mac彻底告别NTFS读写障碍的开源神器
  • 20个必备agent-skills技能一览:从需求定义到代码部署的全流程覆盖
  • dotenv-linter比较模式实战:多环境配置文件差异分析
  • [Triton笔记1]核心概念
  • Windows 11 + GTX 1060 也能跑!GROMACS 2020.6 溶菌酶模拟保姆级避坑指南
  • AListFlutter开发环境搭建:从零开始的Flutter项目构建
  • 3步搞定顽固窗口:WindowResizer让每个程序窗口都听话
  • 终极明日方舟自动化助手:MAA智能解放游戏时间完整指南
  • ThinkPHP 多应用模式与单应用模式在大型项目中如何选择?
  • Reactive Data Client的5个强大特性:为什么你应该选择它
  • 【2026年7月】日本语能力测试N1-N5历年真题及答案PDF电子版(2010-2025年12月)
  • 在多轮对话场景下体验 Taotoken 路由策略的稳定性与容灾
  • 构建企业级AI知识库:基于Jira与Confluence的智能上下文检索系统
  • Houdini FLIP流体高级技巧:用Volume Limits和Narrow Band优化大型海洋场景性能
  • 终极喜马拉雅音频下载解决方案:跨平台免费工具完整指南
  • 4.27-5.3
  • 2026南京防水公司深度调研TOP3榜单(口碑优先版) - GrowthUME
  • 别再手动算中心度了!用Gephi 0.10.1一键搞定社会网络分析(附节点表/边表模板)
  • agent-skills中的测试驱动开发:如何让AI代理写出可靠代码
  • 淘系风控tfstk分析
  • 从CNVD已公开漏洞报告里“淘金”:手把手教你复现并深挖关联漏洞,一份报告变多张证书
  • flutter中 onGenerateRoute回调函数
  • 企业如何利用Taotoken实现多团队API密钥管理与访问审计
  • Kotlin 数据容器 - Array sort 系列方法与 drop 系列方法
  • 3个痛点,1个解决方案:Transmission Remote GUI让你的远程BT下载管理如此简单
  • 为什么同一篇论文知网和维普AI率差这么多:两平台检测原理差异深度解读
  • Spring Boot 3 JWT Security测试指南:如何编写完整的认证授权测试用例