YOLO11涨点优化:特征融合改进 | 结合CARAFE轻量级上采样算子,相较于最近邻插值获得更大感受野和细腻特征
一、写在前面
在目标检测领域,YOLO系列始终是实时检测的标杆。随着Ultralytics在2026年1月YOLO Vision 2024大会上发布YOLO11,这一代模型在精度与效率之间达到了前所未有的平衡。根据Ultralytics官方博客的数据,YOLO11m在COCO数据集上以比YOLOv8m少22%的参数实现了更高的mAP,成为边缘端推理的新标杆。2026年3月,MLCommons正式将YOLO11采纳为MLPerf Inference v6.0 Edge套件的官方目标检测模型,标志着它已成为行业级别的工业基准。
然而,在YOLO11的Neck特征融合部分,仍然沿用着传统的最近邻插值(Nearest Neighbor Interpolation)作为上采样方法。最近邻插值仅考虑子像素邻域,无法捕获密集预测任务所需的丰富语义信息,这在高分辨率检测、小目标定位和密集场景等任务中成为性能瓶颈。
本文将介绍一种轻量级、内容感知的上采样算子——CARAFE(Content-Aware ReAssembly of FEatures),通过替换YOLO11 Neck部分的传统上采样方式,在不显著增加计算开销的前提下,获得更大的感受野和更细腻的特征重建效果,显著提升模型的检测精度。
二、问题诊断:YOLO11的上采样为何需要改进?
2.1 YOLO11 Neck架构回顾
YOLO11的Neck网络采用经典的特征金字塔
