当前位置: 首页 > news >正文

RT-DTER最新创新改进系列:双卷积核(DualConv)结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道,旨在构建轻量级深度神经网络,目标检测有效涨点神器!!

RT-DTER最新创新改进系列:双卷积核(DualConv)结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道,旨在构建轻量级深度神经网络,目标检测有效涨点神器!!

购买相关资料后畅享一对一答疑

畅享超多免费持续更新且可大幅度提升文章档次的纯干货工具!

DualConv: Dual Convolutional Kernels for
Lightweight Deep Neural Networks(提出原文戳这)


为什么要在RT-DTER中引入DualConv?

根本驱动力是在几乎不损失精度的前提下,显著提升模型的推理速度并降低参数数量,使其更好地满足“实时”(RT)的要求。

  1. 强化“实时”特性

    • 问题:RT-DTER虽然名为“Real-Time”(实时),但在移动端或算力受限的边缘设备上,其速度可能仍然面临挑战。标准的卷积操作在计算量和参数量上依然是瓶颈。
    • 动机:DualConv作为一种高效的卷积替代方案,其核心思想是通过分解标准卷积来减少计算负担。将其嵌入RT-DTER的骨干网络中,可以直接“瘦身”模型,加速推理,让“实时”更加名副其实。
  2. 缓解深度卷积的表示瓶颈

    • 问题:许多轻量化网络(如MobileNet)大量使用深度可分离卷积。虽然它非常高效,但它在深度卷积阶段(Depthwise Conv)对每个通道独立卷积,缺少通道间的信息融合,可能导致特征表示能力下降,从而影响识别精度。
    • 动机:DualConv的设计通常包含并行路径,例如一条路径使用深度卷积(保证效率),另一条路径使用点卷积(进行通道融合)。这种结构在保持轻量化的同时,比单纯的深度可分离卷积具有更强的特征表示能力,有助于平衡效率与精度
  3. 优化特征提取流程

    • 问题:标准的卷积层以一种固定的方式聚合空间和通道信息。对于复杂的场景文本,其字体、大小、背景多变,固定的卷积核可能不是最优的。
    • 动机:DualConv的并行结构可以看作是一种多尺度和多感受野的特征提取。一条路径可能捕捉更局部的细节(如字符笔画),另一条路径可能捕捉更全局的上下文(如词语形状)。这种丰富的特征信息对于区分相似字符(如‘l’和‘I’)和应对模糊、低质量文本非常有帮助。

一、原文摘要(了解即可)

CNN 架构通常对内存和计算要求很高,这使得它们对于硬件资源有限的嵌入式系统不可行。 我们提出双卷积核(DualConv)来构建轻量级深度神经网络。 DualConv 结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道,并利用组卷积技术来有效地排列卷积滤波器。 DualConv 可用于任何 CNN 模型,例如用于图像分类的 VGG-16 和 ResNet-50、用于对象检测的 YOLO 和 R-CNN 或用于语义分割的 FCN。 在本文中,我们广泛测试了 DualConv 的分类功能,因为这些网络架构构成了许多其他任务的骨干。 我们还在 YOLO-V3 上测试了 DualConv 的图像检测功能。 实验结果表明,结合我们的结构创新,DualConv 显着降低了深度神经网络的计算成本和参数数量,同时在某些情况下令人惊讶地实现了比原始模型略高的精度。 我们使用 DualConv 将轻量级 MobileNetV2 的参数数量进一步减少了 54%,而在 CIFAR-100 数据集上的准确率仅下降了 0.68%。 当参数数量不是问题时,DualConv 在相同数据集上将 MobileNetV1 的准确率提高了 4.11%。 此外,DualConv 显着提高了 YOLO-V3 目标检测速度,并将其在 PASCAL VOC 数据集上的准确率提高了 4.4%。

(a) 标准卷积、(b) 深度可分离卷积、© 组卷积、(d) 异构卷积和 (e) 所提出的双卷积的卷积滤波器设计。 M是输入通道数(即输入特征图的深度),N是卷积滤波器的数量,也是输出通道的数量(即输出特征图的深度),Di是宽度和高度维度 输入特征图的,K×K是卷积核大小,G是组卷积和对偶卷积中的组数,1/P是异构卷积中3×3卷积核的比例。 请注意,异构滤波器以移位的方式排列[18]。

我们提出了 DualConv,它将 3×3 组卷积与 1×1 逐点卷积相结合,解决了跨通道通信和原始输入特征图中信息保存的问题。 与 HetConv 相比,DualConv 通过添加最少的参数来提高网络性能。 DualConv应用于常见的网络结构来执行图像分类和目标检测。 通过比较标准卷积和 DualConv 的实验结果,证明了所提出的 DualConv 的有效性和效率。 从实验结果可以看出,DualConv 可以集成在标准网络架构和轻量级网络架构中,以提高网络精度并减少网络参数、计算成本和推理时间。 我们还证明了 DualConv 可以很好地适应各种图像数据集,并具有很强的泛化能力。 未来的研究工作将集中在嵌入式设备上的部署,以进一步证明 DualConv 在实际应用中的效率。

跑出结果后-相关方法详情请结合B站视频阅读全文,融入自己文章中!!!

二、 修改步骤!

2.1 修改YAML文件

2.2 新建.py

2.3 修改tasks.py

三、验证是否成功即可

执行命令

python train.py

写在最后

学术因方向、个人实验和写作能力以及具体创新内容的不同而无法做到一通百通,关注UP:Ai学术叫叫兽
在所有B站资料中留下联系方式以便在科研之余为家人们答疑解惑,本up主获得过国奖,发表多篇SCI,擅长目标检测领域,拥有多项竞赛经历,拥有软件著作权,核心期刊等经历。
因为经历过所以更懂小白的痛苦!
因为经历过所以更具有指向性的指导!

祝所有科研工作者都能够在自己的领域上更上一层楼!

以下为给大家庭小伙伴们免费更新过的绘图代码,均配有详细教程,超小白也可一键操作! 后续更多提升文章档次的资料的更新请大家庭的小伙伴关注UP:Ai学术叫叫兽!



http://www.jsqmd.com/news/731074/

相关文章:

  • RedisME:3.x 更新日志(点击版本链接查看图文详情)
  • ZenlessZoneZero-OneDragon:绝区零全自动游戏助手的完整配置指南
  • RedisME:现代、轻量、跨平台的Redis桌面客户端
  • 深度揭秘G-Helper:华硕笔记本性能调校的终极解决方案
  • 如何快速将闲置电视盒子变身高性能Armbian服务器:5个实用技巧让你事半功倍
  • CV炼丹师的效率神器:5分钟看懂CBAM注意力机制,可视化告诉你模型到底在‘看’哪里
  • 2026年环境科学论文降AI工具推荐:生态环境研究知网维普双达标实测指南
  • 如何快速掌握KLayout:开源版图设计工具的完整入门指南
  • RedisME:2.x 更新日志(点击版本链接查看图文详情)
  • RT-DTER最新创新改进系列:融合HCF-NET网络中的DASI模块,红外小目标实验证明针对小目标的改进具有出色表现!
  • 5步完成Switch大气层系统:从零开始构建你的游戏增强平台
  • 2026年|还在焦虑?6款亲测有效的降AI工具推荐,学姐手把手教你降低AI率! - 降AI实验室
  • 【北京跨界国际家居有限公司:私宅别墅设计的一站式解决方案】 - 品牌2026
  • 不止是实验:用四选一多路选择器案例,深入理解Verilog的三种描述风格(行为级、数据流、门级)
  • NVIDIA显卡色彩校准终极指南:novideo_srgb轻松解决广色域显示器色彩过饱和问题
  • 从账单明细看 Taotoken 按 token 计费模式的透明与细致程度
  • 魔兽争霸3终极性能优化指南:如何使用WarcraftHelper解锁300帧流畅体验
  • 如何免费实现网盘直链解析:告别限速与客户端的终极下载指南
  • 安徽省 CPPM 报名(美国采购协会)SCMP 报名(中物联)授权招生报名中心及联系方式 - 众智商学院课程中心
  • 从防御者视角看安卓反调试:你的App真的安全吗?聊聊那些容易被绕过的坑
  • 别再踩坑了!手把手教你为Jenkins 2.357+版本降级到兼容JDK8的旧版(附清华镜像源)
  • Claude Code 怎么配置自定义 API 地址?5 步完整教程
  • 别再手动一根根画了!用立创EDA+Freerouting插件实现‘半自动’高效布线(附最新版插件获取与DRC规则设置)
  • 告别Python-C++通信:用LibTorch 1.7.0在ORB_SLAM3里直接跑YOLOv5做目标定位
  • 游戏性能优化新利器:智能DLSS版本管理工具完全指南
  • 继上一篇文章,引入74HC595芯片扩展I/O口,实现8X8LED点阵多字符滚动显示
  • 如何3分钟掌握AcFunDown?A站视频下载全攻略
  • 别再踩坑了!高德地图AMap.AutoComplete插件不生效的3个关键检查点(附最新安全密钥配置)
  • 现代化开发者环境配置手册:从零搭建高效macOS开发堡垒
  • RK3588 DVP摄像头驱动避坑指南:BT601与BT656接口配置详解及常见错误排查