卷积改进与轻量化:重参数化再升级:RepConv 引入多尺度分支,训练期提取多感受野特征,推理单路无损
一、问题缘起:当单结构不再够用
2026年已经过半,计算机视觉模型在边缘端的部署需求持续井喷。根据Ultralytics官方博客在2026年4月发布的信息,YOLO26 Nano模型在标准CPU上的推理速度较YOLO11提升了高达43%,这标志着边缘AI进入了一个新的加速周期。然而,这个成绩的背后隐藏着一个核心矛盾:模型在训练时需要足够复杂的结构来学习丰富的特征表示,但在推理时又需要足够简单的结构来保证速度。
结构重参数化技术正是为解决这一矛盾而生。自RepVGG提出以来,“训练用多分支、推理用单路”的范式已经成为轻量化模型设计的标准操作。RepConv作为这一思想的典型实现,通过训练阶段的3×3卷积、1×1卷积和恒等映射三路并行,再在推理时融合为单一3×3卷积,实现了精度不降、速度翻倍的效果。
但问题也随之而来:RepConv的三条分支中,3×3卷积分支提供了局部空间特征,1×1分支提供了通道维度的信息变换,恒等映射分支提供了梯度流通的捷径——但所有这些分支,都只有单一的3×3感受野。在面对尺度差异巨大的目标时(比如无人机航拍图像中同时存在的汽车和行人),单一感受野的局限性就会暴露出来。
一篇发表于2026年3月的YOLOv11改进实践文章指出,在YOLOv11原有的三尺度检测头基础上新增小目标检测层后,P2层可以检测到最小分辨率为4×4的目标,这从侧面印证了多尺度感受野对检测性能的关键作用。
那么,能否在RepConv的多分支框架中引入不同尺寸的卷积核,让训练阶段的每条分支承担不同的感受野角色,从而在
