当前位置: 首页 > news >正文

YOLO26最新创新改进系列:(粉丝反馈涨点模型TOP3)融合轻量级网络Ghostnet(幽灵卷积or幻影卷积),实测参数量降低!轻量化水文小神器!

YOLO26最新创新改进系列:(粉丝反馈涨点模型TOP3)融合轻量级网络Ghostnet(幽灵卷积or幻影卷积),实测参数量降低!轻量化水文小神器!

购买相关资料后畅享一对一答疑

畅享超多免费持续更新且可大幅度提升文章档次的纯干货工具!

原文戳这里GhostNet: More Features from Cheap Operations

摘要

该论文提供了一个全新的Ghost模块,旨在通过廉价操作生成更多的特征图。基于一组原始的特征图,作者应用一系列线性变换,以很小的代价生成许多能从原始特征发掘所需信息的“Ghost”特征图(Ghost feature maps)。该Ghost模块即插即用,通过堆叠Ghost模块得出Ghost bottleneck,进而搭建轻量级神经网络——GhostNet。
幻影卷积步骤:
先进行1 x 1卷积聚合通道间的信息特征,然后再使用分组卷积,生成新的特征图。
为了减少网络计算量,作者将传统的卷积分成两步进行,首先通过传统的卷积生成channel较小的特征图以较少的计算量,然后在得到的特征图的基础上,通过cheap operation(depthwise conv,廉价操作)再进一步减少计算量,生成新的特征图,最后将两组特征图拼接到一起,得到最终的output。
卷积操作是卷积-批归一化BN-非线性激活全套组合,而所谓的线性变换或者廉价操作(cheap operation)均指普通卷积,不含批归一化和非线性激活。

一 简介

在效果较好的CNN模型中,特征图存在冗余是非常重要的,但是很少有人在模型结构设计上考虑特征图冗余问题;
从特征图冗余问题出发,提出一个仅通过少量计算(cheap operations)就能生成大量特征图的结构——Ghost Module;
Ghost Module通过一系列线性操作(a series of linear transformations)生成特征图,其中经过线性操作生成的特征图称为ghost feature maps,而被操作的特征图称为intrinsic feature maps;
Ghost Module的优点:
即插即用:Ghost Module是一个即插即用模块,可以无缝衔接现有的CNN中;
使用Ghost Module组成的Ghost bottlenecks,设计出GhostNet,在ILSVRC-2012上top-1超过Mobilenet-V3,并且参数(params)更少。
本文作者在观察ResNet50第一个残差块输出的特征图时,发现有许多输出特征很相似,图一中的红、绿、蓝框的特征图,作者认为很相似,基本只要进行简单的线性变换就能得到,而不需要进行复杂的非线性变换得到;作者该对其中的一个特征图可以通过廉价操作(图中用扳手表示)将另一特征图变换而获得,可以认为其中一个特征图是另一个的“Ghost”。因为,本文提出并非所有特征图都要用卷积操作来得到,“Ghost”特征图可以用更廉价的操作来生成。

二 方法

Ghost Bottlenecks

利用Ghost模块的优势,作者介绍了专门为小型CNN设计的Ghost bottleneck(G-bneck)。

如图所示,Ghost bottleneck似乎类似于ResNet中的基本残差块(Basic Residual Block),其中集成了多个卷积层和shortcut。

Ghost bottleneck主要由两个堆叠的Ghost模块组成:

第一个Ghost模块用作扩展层,增加了通道数,这里将输出通道数与输入通道数之比称为expansion ratio;

第二个Ghost模块减少通道数,以与shortcut路径匹配,然后,使用shortcut连接这两个Ghost模块的输入和输出。

这里借鉴了MobileNetV2,第二个Ghost模块之后不使用ReLU,因为深度卷积后再加ReLU效果会变差,可能是深度卷积输出太浅了, 应用 ReLU会带来信息丢失,其他层在每层之后都应用了批量归一化(BN)和ReLU非线性激活。

上述Ghost bottleneck适用于stride= 1,

对于stride = 2的情况,shortcut路径由下采样层和stride = 2的深度卷积(Depthwise Convolution)来实现。

出于效率考虑,Ghost模块中的初始卷积是逐点卷积(Pointwise Convolution)。

基于Ghost bottleneck,作者提出GhostNet,如下所示:
1.作者遵循MobileNetV3的基本体系结构的优势,然后使用Ghost bottleneck替换MobileNetV3中的bottleneck;
2.GhostNet主要由一堆Ghost bottleneck组成,其中Ghost bottleneck以Ghost模块为构建基础;
第一层是具有16个卷积核的标准卷积层,然后是一系列Ghost bottleneck,通道逐渐增加。这些Ghost bottleneck根据其输入特征图的大小分为不同的阶段;
除了每个阶段的最后一个Ghost bottleneck是stride = 2,其他所有Ghost bottleneck都以stride = 1进行应用;
3.最后,利用全局平均池和卷积层将特征图转换为1280维特征向量以进行最终分类。SE模块也用在了某些Ghost bottleneck中的残留层;
4.与MobileNetV3相比,这里用ReLU换掉了Hard-swish激活函数。尽管进一步的超参数调整或基于自动架构搜索的Ghost模块将进一步提高性能,但下表所提供的架构提供了一个基本设计参考。

三 结论

1.Ghost模块消融实验:当s=2、d=3的时候,Ghost模块的性能优于更小或更大的Ghost模块。这是因为大小为1的内核无法在特征图上引入空间信息,而较大的内核(例如d=5或d=7)会导致过拟合和更多计算。

2.特征图可视化:生成的特征足够灵活,可以满足特定任务的需求。

3.ImageNet分类数据集:通常较大的FLOPs会在这些小型网络中带来更高的准确性,这表明了它们的有效性。而GhostNet在各种计算复杂度级别上始终优于其他竞争对手,主要是因为GhostNet在利用计算资源生成特征图方面效率更高。

4.硬件推理速度:作者的模型总体上胜过其他最新模型,例如谷歌MobileNet系列,ProxylessNAS,FBNet和MnasNet。

5.COCO目标检测数据集:GhostNet可以在单阶段的RetinaNet和两阶段的Faster R-CNN框架上达到和MobileNetV2和MobileNetV3类似的mAP。

四 修改步骤!

4.1 修改YAML文件

4.2 新建.py

4.3 修改tasks.py

五 验证是否成功即可

执行命令

python train.py

改完收工!
关注B站:Ai学术叫叫兽er
从此走上科研快速路
遥遥领先同行!!!!

写在最后

学术因方向、个人实验和写作能力以及具体创新内容的不同而无法做到一通百通,关注我CSDN、B站及抖音:Ai学术叫叫兽
在所有B站资料中留下联系方式以便在科研之余为家人们答疑解惑,本up主获得过国奖,发表多篇SCI,擅长目标检测领域,拥有多项竞赛经历,拥有软件著作权,核心期刊等经历。
因为经历过所以更懂小白的痛苦!
因为经历过所以更具有指向性的指导!

祝所有科研工作者都能够在自己的领域上更上一层楼!

以下为给大家庭小伙伴们免费更新过的绘图代码,均配有详细教程,超小白也可一键操作! 后续更多提升文章档次的资料的更新请大家庭的小伙伴关注我B站及抖音:Ai学术叫叫兽!



http://www.jsqmd.com/news/679824/

相关文章:

  • 富士胶片ApeosPort 3410SD网络扫描配置踩坑实录:从共享文件夹到SMB协议,保姆级避坑指南
  • 考研复试C语言突击:从‘Hello World’到指针数组,这10个高频考点你掌握了吗?
  • 从攻击者视角看Samba安全:一份超全的Samba漏洞年表与防御自查清单(附CVE列表)
  • 2026年Q2金属光纤槽道厂家性价比排行:模压桥架/热浸锌电缆桥架/热镀锌电缆桥架/铝合金电缆桥架/锌铝镁桥架/选择指南 - 优质品牌商家
  • Windows 11终极优化指南:使用Win11Debloat脚本免费提升系统性能40%
  • CTF小白也能懂:手把手教你用Python脚本破解RSA(附攻防世界Crypto cr4-poor-rsa实战)
  • 别再让笔记本在包里‘发烧’了!手把手教你将Windows 11的Modern Standby改回传统S3睡眠
  • STM32F407项目实战:用模拟IIC驱动0.96寸OLED做个简易示波器
  • STM32G431备赛避坑指南:从蓝桥杯第十一届省赛代码里学到的5个调试技巧
  • Java项目Loom化实战血泪总结(仅限内部技术委员会解密版):5大反模式、4套基准测试脚本、1份灰度发布Checklist
  • 嵌入式设备RTC时钟模块选型指南:为什么RX8130CE在Mstar平台上这么香?
  • 从拉格朗日到KKT:一次搞懂凸优化中的‘最优解凭证’与代码验证(Python示例)
  • VoiceFixer:三分钟让模糊语音变清晰的AI音频修复神器
  • ORB_SLAM3实战:IMU与相机时间戳不同步?手把手教你解决D435i数据融合的“老大难”问题
  • 别再只会点对点了!深入解读NRF24L01的1对6通信与Enhanced ShockBurst模式
  • 告别uni.request的‘幽灵错误’:手把手封装一个带自动重试与错误诊断的请求库
  • 告别‘石头剪刀布’:用HaGRID数据集和YOLOv5训练一个能识别18种手势的AI模型
  • YOLO26最新创新改进系列:融合YOLOv9下采样机制ADown,强强联合!扩大YOLO网络模型感受野,降低过拟合,让小目标无处可遁!检测精度再提新高!!
  • TSP问题入门:别再死记概念,用‘最邻近’和‘插入法’带你直观理解近似解优劣
  • 告别OA系统!用Spring Boot + Flowable 6.7.2为你的CRM合同审批加个‘发动机’
  • KeePass进阶玩法:搭配这几款插件,实现浏览器自动填充与跨设备同步
  • Vivado里给MicroBlaze软核配时钟和AXI总线,新手最容易踩的这几个坑
  • 2026锅炉行业标杆名录:锅炉制造厂家、锅炉厂家哪家好、锅炉批发、锅炉质量、乐山锅炉厂家、乐山锅炉推荐、乐山锅炉生产厂家选择指南 - 优质品牌商家
  • 别再死记硬背!从‘寻宝大冒险’题解看CCF-CSP第二题常见的暴力破解与优化边界
  • 智能家居项目翻车实录:聊聊嵌入式IoT开发中那些容易踩的坑(附避坑指南)
  • 从Excel合并单元格到Power BI完美表格:Power Query填充与替换功能实战避坑指南
  • 你的云服务器安全组真的设对了吗?从一次DDoS攻击聊聊Linux防火墙的‘隐形’风险
  • 避坑指南:Matlab仿真电磁波传播时,如何让波形‘动起来’不卡顿?
  • 别再为噪声头疼了!用MATLAB实现加权最小二乘相位解包裹(附残点计算代码)
  • 别再为WebSocket握手失败头疼了!手把手教你用Nginx 1.18+配置WSS反向代理(附SSL证书配置)