当前位置：首页 > news >正文

RT-DTER最新创新改进系列：双卷积核（DualConv）结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道，旨在构建轻量级深度神经网络,目标检测有效涨点神器！！

news 2026/6/26 12:17:10

RT-DTER最新创新改进系列：双卷积核（DualConv）结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道，旨在构建轻量级深度神经网络,目标检测有效涨点神器！！

购买相关资料后畅享一对一答疑！

畅享超多免费持续更新且可大幅度提升文章档次的纯干货工具！

DualConv: Dual Convolutional Kernels for
Lightweight Deep Neural Networks（提出原文戳这）

为什么要在RT-DTER中引入DualConv？

根本驱动力是在几乎不损失精度的前提下，显著提升模型的推理速度并降低参数数量，使其更好地满足“实时”（RT）的要求。

强化“实时”特性
- 问题：RT-DTER虽然名为“Real-Time”（实时），但在移动端或算力受限的边缘设备上，其速度可能仍然面临挑战。标准的卷积操作在计算量和参数量上依然是瓶颈。
- 动机：DualConv作为一种高效的卷积替代方案，其核心思想是通过分解标准卷积来减少计算负担。将其嵌入RT-DTER的骨干网络中，可以直接“瘦身”模型，加速推理，让“实时”更加名副其实。
缓解深度卷积的表示瓶颈
- 问题：许多轻量化网络（如MobileNet）大量使用深度可分离卷积。虽然它非常高效，但它在深度卷积阶段（Depthwise Conv）对每个通道独立卷积，缺少通道间的信息融合，可能导致特征表示能力下降，从而影响识别精度。
- 动机：DualConv的设计通常包含并行路径，例如一条路径使用深度卷积（保证效率），另一条路径使用点卷积（进行通道融合）。这种结构在保持轻量化的同时，比单纯的深度可分离卷积具有更强的特征表示能力，有助于平衡效率与精度。
优化特征提取流程
- 问题：标准的卷积层以一种固定的方式聚合空间和通道信息。对于复杂的场景文本，其字体、大小、背景多变，固定的卷积核可能不是最优的。
- 动机：DualConv的并行结构可以看作是一种多尺度和多感受野的特征提取。一条路径可能捕捉更局部的细节（如字符笔画），另一条路径可能捕捉更全局的上下文（如词语形状）。这种丰富的特征信息对于区分相似字符（如‘l’和‘I’）和应对模糊、低质量文本非常有帮助。

一、原文摘要（了解即可）

CNN 架构通常对内存和计算要求很高，这使得它们对于硬件资源有限的嵌入式系统不可行。我们提出双卷积核（DualConv）来构建轻量级深度神经网络。 DualConv 结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道，并利用组卷积技术来有效地排列卷积滤波器。 DualConv 可用于任何 CNN 模型，例如用于图像分类的 VGG-16 和 ResNet-50、用于对象检测的 YOLO 和 R-CNN 或用于语义分割的 FCN。在本文中，我们广泛测试了 DualConv 的分类功能，因为这些网络架构构成了许多其他任务的骨干。我们还在 YOLO-V3 上测试了 DualConv 的图像检测功能。实验结果表明，结合我们的结构创新，DualConv 显着降低了深度神经网络的计算成本和参数数量，同时在某些情况下令人惊讶地实现了比原始模型略高的精度。我们使用 DualConv 将轻量级 MobileNetV2 的参数数量进一步减少了 54%，而在 CIFAR-100 数据集上的准确率仅下降了 0.68%。当参数数量不是问题时，DualConv 在相同数据集上将 MobileNetV1 的准确率提高了 4.11%。此外，DualConv 显着提高了 YOLO-V3 目标检测速度，并将其在 PASCAL VOC 数据集上的准确率提高了 4.4%。

(a) 标准卷积、(b) 深度可分离卷积、© 组卷积、(d) 异构卷积和 (e) 所提出的双卷积的卷积滤波器设计。 M是输入通道数（即输入特征图的深度），N是卷积滤波器的数量，也是输出通道的数量（即输出特征图的深度），Di是宽度和高度维度输入特征图的，K×K是卷积核大小，G是组卷积和对偶卷积中的组数，1/P是异构卷积中3×3卷积核的比例。请注意，异构滤波器以移位的方式排列[18]。

我们提出了 DualConv，它将 3×3 组卷积与 1×1 逐点卷积相结合，解决了跨通道通信和原始输入特征图中信息保存的问题。与 HetConv 相比，DualConv 通过添加最少的参数来提高网络性能。 DualConv应用于常见的网络结构来执行图像分类和目标检测。通过比较标准卷积和 DualConv 的实验结果，证明了所提出的 DualConv 的有效性和效率。从实验结果可以看出，DualConv 可以集成在标准网络架构和轻量级网络架构中，以提高网络精度并减少网络参数、计算成本和推理时间。我们还证明了 DualConv 可以很好地适应各种图像数据集，并具有很强的泛化能力。未来的研究工作将集中在嵌入式设备上的部署，以进一步证明 DualConv 在实际应用中的效率。

跑出结果后-相关方法详情请结合B站视频阅读全文，融入自己文章中！！！

二、修改步骤！

2.1 修改YAML文件

2.2 新建.py

2.3 修改tasks.py

三、验证是否成功即可

执行命令

python train.py

写在最后

学术因方向、个人实验和写作能力以及具体创新内容的不同而无法做到一通百通，关注UP：Ai学术叫叫兽
在所有B站资料中留下联系方式以便在科研之余为家人们答疑解惑，本up主获得过国奖，发表多篇SCI，擅长目标检测领域，拥有多项竞赛经历，拥有软件著作权，核心期刊等经历。
因为经历过所以更懂小白的痛苦！
因为经历过所以更具有指向性的指导！

祝所有科研工作者都能够在自己的领域上更上一层楼！