当前位置: 首页 > news >正文

YOLOv11 改进 - C2PSA C2PSA融合Mona多认知视觉适配器(CVPR 2025):打破全参数微调的性能枷锁:即插即用的提点神器,引领视觉微调新突破

# 前言

本文介绍了新型视觉适配器微调方法Mona,并将其集成到YOLOv11中。传统全参数微调成本高、存储负担重且有过拟合风险,现有PEFT方法性能落后。Mona仅调整5%以内的骨干网络参数,在多个视觉任务中超越全参数微调。其核心亮点包括参数效率高、性能突破和即插即用。适配器模块包含降维、多认知视觉滤波器等单元,通过深度可分离卷积和多尺度卷积核处理视觉信号,还加入分布适配层优化输入分布。我们将Mona集成到YOLOv11,经注册和配置yaml文件后进行实验,展现出良好效果。

文章目录: YOLOv11改进大全:卷积层、轻量化、注意力机制、损失函数、Backbone、SPPF、Neck、检测头全方位优化汇总

专栏链接: YOLOv11改进专栏

介绍

image-20251212235512548

摘要

Mona(Multi-cognitive Visual Adapter)是一种新型视觉适配器微调方法,旨在打破传统全参数微调(full fine-tuning)在视觉识别任务中的性能瓶颈。Mona 方法通过引入多认知视觉滤波器和优化输入分布,仅调整 5% 的骨干网络参数,就能在实例分割、目标检测、旋转目标检测等多个经典视觉任务中超越全参数微调的效果,显著降低了适配和存储成本,为视觉模型的高效微调提供了新的思路。

文章链接

论文地址:论文地址

代码地址:代码地址

基本原理

Mona是由清华大学、国科大、上海交大、阿里巴巴联合提出的新型视觉适配器微调方法,相关论文《5%>100%: Breaking Performance Shackles of Full Fine-Tuning on Visual Recognition Tasks》已被CVPR2025收录,其核心目标是打破传统全参数微调的性能与成本枷锁,为视觉大模型高效微调提供新方案。

一、提出背景

  1. 传统全参数微调的痛点
    • 成本极高:需更新模型全部参数,以早期BERT为例,单卡训练100万数据需5-7小时,万亿级参数模型的微调对硬件和时间要求更苛刻;
    • 存储负担重:多任务场景下需为每个任务保存完整模型副本;
    • 存在过拟合风险:大模型直接微调易因数据分布差异出现性能下降。
  2. 现有PEFT方法的局限
    参数高效微调(PEFT)虽能仅调整少量参数实现模型适配,但视觉领域的多数PEFT方法性能仍落后于全参数微调,无法兼顾效率与效果。

二、核心亮点

  1. 参数效率极高:仅调整5%以内的骨干网络参数,远低于传统PEFT方法的参数改动占比,大幅降低适配和存储成本;
  2. 性能突破枷锁:在实例分割、目标检测、图像分类等多类视觉任务中,首次实现小于5%参数成本下超越全参数微调的性能;
  3. 即插即用特性:可便捷嵌入现有视觉模型架构(如Swin-Transformer),无需大规模重构模型。

三、方法架构与核心设计

1. 整体模块结构

Mona的适配器模块包含降维、多认知视觉滤波器、激活函数、升维等单元,并内置跳跃连接(Skip-Connections),可无缝集成至Swin-Transformer等主流视觉骨干网络,整体流程为:输入特征经LayerNorm处理后,先降维至内部维度,再通过多认知滤波器增强特征表达,经GELU激活和dropout后升维还原,最终与原始特征残差连接输出。

2. 两大核心创新设计

  1. 多认知视觉滤波器
    这是Mona的核心模块,通过深度可分离卷积多尺度卷积核(3×3、5×5、7×7)实现对二维视觉信号的精准处理,与传统线性适配器不同,其专门针对视觉任务设计,可完成多尺度特征融合,提升模型对视觉信息的理解能力,具体是将3种尺度卷积的输出均值后与原始特征残差连接,再经1×1卷积投影优化。
  2. 输入分布优化
    在适配器前端加入分布适配层(Scaled LayerNorm),通过可学习参数gammagammax调整输入特征分布,使预训练特征更适配适配器的处理逻辑,提升微调效率。

img

核心代码

class Mona(BaseModule):def __init__(self,in_dim,factor=4):super().__init__()self.project1 = nn.Linear(in_dim, 64)self.nonlinear = F.geluself.project2 = nn.Linear(64, in_dim)self.dropout = nn.Dropout(p=0.1)self.adapter_conv = MonaOp(64)self.norm = nn.LayerNorm(in_dim)self.gamma = nn.Parameter(torch.ones(in_dim) * 1e-6)self.gammax = nn.Parameter(torch.ones(in_dim))def forward(self, x, hw_shapes=None):identity = xx = self.norm(x) * self.gamma + x * self.gammaxproject1 = self.project1(x)b, n, c = project1.shapeh, w = hw_shapesproject1 = project1.reshape(b, h, w, c).permute(0, 3, 1, 2)project1 = self.adapter_conv(project1)project1 = project1.permute(0, 2, 3, 1).reshape(b, n, c)nonlinear = self.nonlinear(project1)nonlinear = self.dropout(nonlinear)project2 = self.project2(nonlinear)return identity + project2

实验

脚本

import warnings
warnings.filterwarnings('ignore')
from ultralytics import YOLO
# 
if __name__ == '__main__':
#     修改为自己的配置文件地址model = YOLO('./ultralytics/cfg/models/11/yolov11-C2PSA_Mona.yaml')
#     修改为自己的数据集地址model.train(data='./ultralytics/cfg/datasets/coco8.yaml',cache=False,imgsz=640,epochs=10,single_cls=False,  # 是否是单类别检测batch=8,close_mosaic=10,workers=0,optimizer='SGD',amp=True,project='runs/train',name='C2PSA_Mona',)

结果

image-20251213005218443

http://www.jsqmd.com/news/349900/

相关文章:

  • ‌经济波动下的副业安全网:测试技能多元化应用
  • 电池认证新方案:IACheck提升电池PSE认证质量
  • 2026最新SATA连接器推荐!国内优质SATA连接器权威榜单发布,资质服务双优助力多场景稳定连接SATA连接器推荐 - 品牌推荐2026
  • 2026噪音治理公司哪家强?四川三元覆盖工业与民生降噪场景 - 深度智识库
  • HGDB创建大写的表名
  • 收藏!程序员必看:社会的本质是竞争,大模型才是普通人的破局之路
  • 【论文技巧】挑战极限:实测“快降重”如何将高AI率综述文献8分钟“脱胎换骨”
  • 电子书出版指南:测试工程师的被动收入来源
  • 收藏备用|Agent智能体全面解析(小白/程序员必看):定义、优势、挑战及发展前景
  • ‌从测试到产品经理:职业跃迁的必备技能
  • 人到中年,程序猿的人生路2026~
  • 讲讲大观可惟为中国品牌价值排名相关情况,选哪家比较靠谱 - 工业品牌热点
  • YOLOv11 改进 - C2PSA C2PSA融合MSLA多尺度线性注意力(Arxiv2025 ):并行多分支架构融合上下文语义,提升特征判别力
  • 2026年豆包AI平台GEO优化推广公司/服务商榜单:五大顶尖公司技术及实战案例解析 - 深圳昊客网络
  • 大模型微调参数设置 —— 新手必看的核心参数与优化技巧
  • 朔州市英语雅思培训辅导机构推荐:2026权威出国雅思课程中心学校口碑排行榜 - 苏木2025
  • 分析2026年岳阳新房家装公司排名,名匠装饰位列前列服务优 - mypinpai
  • 春节福利场景下,沃尔玛购物卡变现成新潮流,背后是消费需求的真实迭代 - 团团收购物卡回收
  • 聊聊2026年昆明知名的装修设计公司哪家性价比高 - 工业品网
  • 朔州市英语雅思培训辅导机构推荐-2026权威出国雅思课程中心学校口碑排行榜 - 苏木2025
  • gorm使用gen自动生成模型和查询文件
  • 2026年,“配置工程师“终于死绝了
  • 2026年半导体切割机制造公司品质评价排名,哪家公司更靠谱 - 工业品牌热点
  • 朔州市英语雅思培训辅导机构推荐;2026权威出国雅思课程中心学校口碑排行榜 - 苏木2025
  • 企业AI获客服务企业怎么选择,鲸荣科技有何亮点 - mypinpai
  • How to Share A Folder in Ubuntu 23.10 Updated [Fix ‘Error 255’ issue]
  • 以浪为马:在不确定时代下,HeyGen 的组织哲学与技术人的生存法则
  • 荣耀WIN系列双旗舰登场:风扇直吹芯片,满帧温控表现抢眼
  • 详细介绍:单元测试(JUnit、Mockito、PowerMock )
  • 作为开发,该如何给产品提有效建议