RT-DTER最新创新改进系列:双卷积核(DualConv)结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道,旨在构建轻量级深度神经网络,目标检测有效涨点神器!!
RT-DTER最新创新改进系列:双卷积核(DualConv)结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道,旨在构建轻量级深度神经网络,目标检测有效涨点神器!!
购买相关资料后畅享一对一答疑!
畅享超多免费持续更新且可大幅度提升文章档次的纯干货工具!
DualConv: Dual Convolutional Kernels for
Lightweight Deep Neural Networks(提出原文戳这)
为什么要在RT-DTER中引入DualConv?
根本驱动力是在几乎不损失精度的前提下,显著提升模型的推理速度并降低参数数量,使其更好地满足“实时”(RT)的要求。
强化“实时”特性
- 问题:RT-DTER虽然名为“Real-Time”(实时),但在移动端或算力受限的边缘设备上,其速度可能仍然面临挑战。标准的卷积操作在计算量和参数量上依然是瓶颈。
- 动机:DualConv作为一种高效的卷积替代方案,其核心思想是通过分解标准卷积来减少计算负担。将其嵌入RT-DTER的骨干网络中,可以直接“瘦身”模型,加速推理,让“实时”更加名副其实。
缓解深度卷积的表示瓶颈
- 问题:许多轻量化网络(如MobileNet)大量使用深度可分离卷积。虽然它非常高效,但它在深度卷积阶段(Depthwise Conv)对每个通道独立卷积,缺少通道间的信息融合,可能导致特征表示能力下降,从而影响识别精度。
- 动机:DualConv的设计通常包含并行路径,例如一条路径使用深度卷积(保证效率),另一条路径使用点卷积(进行通道融合)。这种结构在保持轻量化的同时,比单纯的深度可分离卷积具有更强的特征表示能力,有助于平衡效率与精度。
优化特征提取流程
- 问题:标准的卷积层以一种固定的方式聚合空间和通道信息。对于复杂的场景文本,其字体、大小、背景多变,固定的卷积核可能不是最优的。
- 动机:DualConv的并行结构可以看作是一种多尺度和多感受野的特征提取。一条路径可能捕捉更局部的细节(如字符笔画),另一条路径可能捕捉更全局的上下文(如词语形状)。这种丰富的特征信息对于区分相似字符(如‘l’和‘I’)和应对模糊、低质量文本非常有帮助。
一、原文摘要(了解即可)
CNN 架构通常对内存和计算要求很高,这使得它们对于硬件资源有限的嵌入式系统不可行。 我们提出双卷积核(DualConv)来构建轻量级深度神经网络。 DualConv 结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道,并利用组卷积技术来有效地排列卷积滤波器。 DualConv 可用于任何 CNN 模型,例如用于图像分类的 VGG-16 和 ResNet-50、用于对象检测的 YOLO 和 R-CNN 或用于语义分割的 FCN。 在本文中,我们广泛测试了 DualConv 的分类功能,因为这些网络架构构成了许多其他任务的骨干。 我们还在 YOLO-V3 上测试了 DualConv 的图像检测功能。 实验结果表明,结合我们的结构创新,DualConv 显着降低了深度神经网络的计算成本和参数数量,同时在某些情况下令人惊讶地实现了比原始模型略高的精度。 我们使用 DualConv 将轻量级 MobileNetV2 的参数数量进一步减少了 54%,而在 CIFAR-100 数据集上的准确率仅下降了 0.68%。 当参数数量不是问题时,DualConv 在相同数据集上将 MobileNetV1 的准确率提高了 4.11%。 此外,DualConv 显着提高了 YOLO-V3 目标检测速度,并将其在 PASCAL VOC 数据集上的准确率提高了 4.4%。
(a) 标准卷积、(b) 深度可分离卷积、© 组卷积、(d) 异构卷积和 (e) 所提出的双卷积的卷积滤波器设计。 M是输入通道数(即输入特征图的深度),N是卷积滤波器的数量,也是输出通道的数量(即输出特征图的深度),Di是宽度和高度维度 输入特征图的,K×K是卷积核大小,G是组卷积和对偶卷积中的组数,1/P是异构卷积中3×3卷积核的比例。 请注意,异构滤波器以移位的方式排列[18]。
我们提出了 DualConv,它将 3×3 组卷积与 1×1 逐点卷积相结合,解决了跨通道通信和原始输入特征图中信息保存的问题。 与 HetConv 相比,DualConv 通过添加最少的参数来提高网络性能。 DualConv应用于常见的网络结构来执行图像分类和目标检测。 通过比较标准卷积和 DualConv 的实验结果,证明了所提出的 DualConv 的有效性和效率。 从实验结果可以看出,DualConv 可以集成在标准网络架构和轻量级网络架构中,以提高网络精度并减少网络参数、计算成本和推理时间。 我们还证明了 DualConv 可以很好地适应各种图像数据集,并具有很强的泛化能力。 未来的研究工作将集中在嵌入式设备上的部署,以进一步证明 DualConv 在实际应用中的效率。
跑出结果后-相关方法详情请结合B站视频阅读全文,融入自己文章中!!!
二、 修改步骤!
2.1 修改YAML文件
2.2 新建.py
2.3 修改tasks.py
三、验证是否成功即可
执行命令
python train.py写在最后
学术因方向、个人实验和写作能力以及具体创新内容的不同而无法做到一通百通,关注UP:Ai学术叫叫兽
在所有B站资料中留下联系方式以便在科研之余为家人们答疑解惑,本up主获得过国奖,发表多篇SCI,擅长目标检测领域,拥有多项竞赛经历,拥有软件著作权,核心期刊等经历。
因为经历过所以更懂小白的痛苦!
因为经历过所以更具有指向性的指导!
祝所有科研工作者都能够在自己的领域上更上一层楼!
