当前位置: 首页 > news >正文

YOLO系列算法改进 | 主干改进篇 | 替换SHViT高效视觉变换器 | 助力模型极致轻量化,同时保持高精度性能! | CVPR 2024

0. 前言

本文介绍了SHViT高效视觉变换器,并将其集成到ultralytics最新发布的YOLO26目标检测算法中,替换原有Backbone网络。SHViT的创新在于从宏观和微观两个层面系统性消除计算冗余,通过大步长块化主干和单头部分通道注意力,以最少的内存访问成本实现超快视觉推理。将其作为YOLO的backbone,将使目标检测在边缘设备上以突破性的速度运行,同时保持高精度,特别适合需要极致实时性、高分辨率输入和多平台统一部署的应用场景。

专栏链接:YOLO系列算法改进专栏链接

专栏文章:YOLO26改进系列 | 卷积篇、轻量化、注意力、损失函数、Backbone、SPPF、C2PSA、Neck、检测头全方面保姆级优化合集 | 同样适配YOLOv11改进!!!

目录

0. 前言

1. SHViT网络简介

2. SHViT网络原理与创新点

🧠 SHViT网络基本原理

🎯 SHViT网络创新点

3. 具体改进步骤

🍀🍀步骤1:创建SHViT.py文件

🍀🍀步骤2:tasks.py文件修改

⚡1. SHViT网络导入

⚡2. SHViT网络注册

⚡3. 其他修改1(Ctrl+F搜索定位一下)

⚡4. 其他修改2(Ctrl+F搜索定位一下)

⚡5. 其他修改3(_predict_once函数修改)

🍀🍀步骤3:创建YAML配置文件

🍀🍀步骤4:新建train.py文件训练模型

🍀🍀步骤5:模型结构打印结果


1. SHViT网络简介

近年来,高效的视觉Transformer在资源受限设备上以低延迟表现出卓越的性能。传统上,它们在宏观层面采用4×4块嵌入和4阶段结构,同时在微观层面利用多头配置的复杂注意力。本文旨在以内存高效的方式解决所有设计层面的计算冗余。我们发现,使用更大步长的块化主干不仅可以减少内存访问成本,而且通过从早期阶段就开始利用具有降低空间冗余的令牌表示,还能实现有竞争力的性能。此外,我们的初步分析表明,早期阶段的注意力层可以用卷积替代,而后期阶段的多个注意力头在计算上是冗余的。为解决这一问题,我们引入了一种单头注意力模块,它从本质上防止了头冗余,并通过并行结合全局和局部信息同时提高精度。基于我们的解决方案,我们提出了SHViT,一种单头视觉Transformer,它在速度-精度权衡上达到了最先进的水平。例如,在ImageNet-1k上,我们的SHViT-S4在GPU、CPU和iPhone12移动设备上分别比MobileViTv2×1.0快3.3倍、8.1倍和2.4倍,同时精度高出1.3%。在MS COCO上使用Mask-RCNN头进行的目标检测和实例分割任务中,我们的模型在GPU和移动设备上的骨干延迟分别比FastViT-SA12低3.8倍和2.0倍,同时性能相当。

http://www.jsqmd.com/news/501686/

相关文章:

  • 【qml】linux引入QtXlsxWriter库
  • 层叠式过滤器哪家好?3家生产企业实测对比,推荐高性价比厂家 - 品牌推荐大师1
  • PLC和传感器神仙打架?疆鸿智能EtherNet/IP转Modbus TCP网关来劝和!
  • 编译lincity-ng inMacOS(index: jam, LDFLAGS, CFLAGS, CXXFLAGS)
  • LangChain内置中间件总结
  • 2026年阿里云企业邮箱配置指南:套餐解析与协同办公价值 - 品牌2026
  • 金仓数据库在MySQL迁移中的实践复盘:一家三甲医院电子病历系统性能与成本优化实录
  • C++多态入门(下):抽象类与多态原理,从纯虚函数到虚表机制深度解析(附高频面试题)
  • 支付宝立减金快速回收攻略:轻松变现无需等待 - 团团收购物卡回收
  • 属电子信息类专业电子信息工程(Electronic Information Engineering,简称 EE)专业是什么?
  • 初学者必备的BUCK DCDC转换器学习指南:基于TSMC18工艺恒定时间控制,涵盖设计仿真、...
  • 2026 成都化妆美甲培训学校排名:本地实战与就业推荐 - 梅1梅
  • 网页绘图,无需注册
  • 在上海怎么买腾讯企业邮箱?2026年最新联系方式与报价指南 - 品牌2026
  • pmsm基于新型非奇异快速终端的滑模+dpc无差电流预测控制。 速度控制器采用新型非奇异滑模面...
  • 金仓数据库在MySQL迁移中的技术观察:高兼容性与平滑替代路径实践
  • openclaw 本地部署ollama模型使用
  • 计算机毕业设计之springboot学生会事务管理平台的设计与实现
  • 选购塑料托盘如何选择靠谱品牌 - 工业推荐榜
  • 2026年阿里云企业邮箱收费标准详解:标准版、集团版与尊享版价格全解析 - 品牌2026
  • android java设置控件不可见+高度=0
  • 全面理解MySQL架构
  • 深度学习野外环境下野生动物检测(YOLOv12/v11/v8/v5模型+数据集)(源码+lw+部署文档+讲解等)
  • 国内代理IP地域选择与降低延迟方法
  • 北京对不同材质清洁专业的家政公司收费贵吗,推荐哪家 - mypinpai
  • 2026年阿里企业邮箱联系电话查询指南:官方服务渠道与套餐价格解析 - 品牌2026
  • 微信私域流量经营:构建“引流-沉淀-转化”闭环,赋能品牌长效增长
  • 【C++项目】从零实现高并发内存池(一):核心原理与设计思路
  • 在 SAP BTP 上选对开发武器:从 No/Low Code 到 Pro-Code 的项目落地指南
  • 079基于spring+boot的快递分拣管理系统-springboot+vue