当前位置: 首页 > news >正文

130、共享卷积 Head:分类和回归分支共享前三层卷积的参数共享策略与效果

130、共享卷积 Head:分类和回归分支共享前三层卷积的参数共享策略与效果

从一次诡异的mAP震荡说起

去年年底调一个YOLOv8的工业检测项目,分类和回归分支各自独立,训练到第120个epoch时mAP突然从0.87掉到0.82,然后又在10个epoch内弹回0.88。我盯着WandB的曲线看了半小时,发现分类分支的loss在震荡,回归分支却稳如老狗。直觉告诉我——两个分支的卷积层在互相“打架”,尤其是浅层特征提取部分,它们学到的模式高度重叠,但参数却各自独立更新,导致梯度方向不一致。

这个现象在YOLOv5时代就有人提过,但当时大家更关注Neck结构。直到YOLOv8把Head改成解耦结构(Decoupled Head),分类和回归分支各自拥有独立的3x3卷积层,问题才被放大。我当时的解决方案很简单:让两个分支共享前三层卷积的参数,只在最后一层分开。效果立竿见影,mAP稳定了,参数量还降了15%。

共享卷积Head的设计思路

YOLOv11的Head结构延续了YOLOv8的解耦设计,但多了一个细节:每个分支内部有3个连续的3x3卷积层(带BN和SiLU),然后接各自的输出层。分类分支输出形状为[B, num_classes, H, W],回归分支输出[B, 4*reg_max, H, W](这里reg_max是DFL的bin数,YOLOv11默认16)。

共享策略的核心是:分类和回归分支的前k层(这里k=3)共用同一组

http://www.jsqmd.com/news/1132883/

相关文章:

  • 基于3D整数小波与超混沌系统的彩色图像加密算法详解与Matlab实现
  • 机械专业不想干纯设计,可以转什么方向?2026年热门转型指南
  • 本地化代码生成AI部署指南:从环境配置到API集成实践
  • 使用 Oracle EBS 的中国企业Oracle EBS在中国金融、电信、能源等行业有大量深度用户,尤其在银行和保险行业占据主导地位。金融行业(银行)这是Oracle EBS在中国最集中的用户
  • RIP实验需求配置
  • ALVR无线VR串流:释放你的PC VR游戏,体验无拘无束的虚拟现实
  • Windows 下Maven安装配置(本地仓库配置)
  • E-Ink Launcher:为电子阅读器打造的极致省电Android启动器
  • 暑假40天极速学Python!大学生零基础保姆级上岸路线(从入门到可做项目)
  • SMUDebugTool:锐龙处理器性能调试的终极指南,轻松实现超频优化与系统监控
  • Cangaroo:当袋鼠跳跃在CAN总线上的开源奇迹
  • 真原生,非外挂:Agentic CRM 时代,什么才是真正的 AI 原生CRM
  • 中国企业里用 Oracle EBS​ 和 SAP​ 的都是各自领域的头部大户,但两边的“基本盘“不太一样——Oracle EBS 在电信/金融/航空/钢铁偏强,SAP 在制造业/汽车/能源/央企更占主
  • C++之libCurl实现HTTP请求
  • Palworld存档转换工具:三步实现游戏数据自由编辑
  • Linux应急响应实战指南:从入侵检测到系统加固的完整流程
  • YOLO目标检测从入门到精通:核心原理、版本演进与实战部署指南
  • bert-ancient-chinese 模型部署与实战:在《左传》分词任务上实现 96.32% F1 分数
  • 3大挑战+5步实战:Windows风扇控制终极指南
  • AI 数据问答权限:自然语言不能绕过指标边界
  • 英雄联盟终极辅助工具:League-Toolkit 完整使用指南
  • VisualCppRedist AIO:Windows运行库问题的终极一站式解决方案
  • 3步让经典Direct3D 8游戏在Windows 10/11完美运行:免费兼容性解决方案终极指南
  • WeChatMsg终极指南:3步永久保存微信聊天记录并生成年度报告
  • 音乐歌词批量获取神器:163MusicLyrics完整使用指南
  • 从模糊到高清:使用Waifu2x-Extension-GUI实现AI超分辨率与视频补帧的终极指南
  • BigQuery新手实战指南:从数据导入到高效查询避坑全解析
  • FanControl:从零开始打造你的个性化风扇控制系统
  • AI规划能力测试:从推箱子游戏看世界模型与推理技术
  • 小智MCP一键部署客户端(windows极简方案)