当前位置: 首页 > news >正文

YOLO系列算法改进 | 主干改进篇 | 替换ParameterNet参数优先网络 | 利用动态卷积自适应调整卷积核,助力模型低光照下增强边缘响应 | CVPR 2024

0. 前言

本文介绍了ParameterNet网络,并将其集成到ultralytics最新发布的YOLO26目标检测算法中,替换原有Backbone网络。ParameterNet的创新在于重新定义了轻量级网络的设计哲学——不再追求参数量的极致压缩,而是在不增加推理计算量的前提下,尽可能增加参数量,让轻量网络也能享受大规模预训练的红利。此外,利用动态卷积自适应调整卷积核,助力模型低光照下增强边缘响应。

专栏链接:YOLO系列算法改进专栏链接

专栏文章:YOLO26改进系列 | 卷积篇、轻量化、注意力、损失函数、Backbone、SPPF、C2PSA、Neck、检测头全方面保姆级优化合集 | 同样适配YOLOv11改进!!!

目录

0. 前言

1. ParameterNet网络简介

2. ParameterNet网络原理与创新点

🧠 ParameterNet网络基本原理

🎯 ParameterNet网络创新点

3. 具体改进步骤

🍀🍀步骤1:创建ParameterNet.py文件

🍀🍀步骤2:tasks.py文件修改

⚡1. ParameterNet网络导入

⚡2. ParameterNet网络注册

⚡3. 其他修改1(Ctrl+F搜索定位一下)

⚡4. 其他修改2(Ctrl+F搜索定位一下)

⚡5. 其他修改3(_predict_once函数修改)

🍀🍀步骤3:创建YAML配置文件

🍀🍀步骤4:新建train.py文件训练模型

🍀🍀步骤5:模型结构打印结果


1. ParameterNet网络简介

大规模视觉预训练显著提升了大型视觉模型的性能。然而,我们观察到一个现象——低FLOPs陷阱,即现有的低FLOPs模型无法从大规模预训练中受益。在本文中,我们引入了一种新颖的设计原则,称为ParameterNet,旨在在大规模视觉预训练模型中增加参数数量的同时,最小化FLOPs的增加。我们利用动态卷积在网络中引入额外参数,而FLOPs的增加仅为微量。ParameterNet方法使低FLOPs网络能够利用大规模视觉预训练。此外,我们将ParameterNet概念扩展到语言领域,以在保持推理速度的同时增强推理结果。在大规模ImageNet-22K数据集上的实验表明了ParameterNet方案的优越性。例如,ParameterNet-600M在ImageNet上的准确率比广泛使用的Swin Transformer更高(81.6% vs. 80.9%),且其FLOPs更低(0.6G vs. 4.5G)。在语言领域,增强了ParameterNet的LLaMA-1B比原始LLaMA提高了2%的准确率。

http://www.jsqmd.com/news/487655/

相关文章:

  • 永磁同步电机矢量控制FOC仿真:id=0与MTPA两种控制策略的对比分析与参考文献
  • P2679 [NOIP 2015 提高组] 子串
  • 3-16午夜盘思
  • 深入探究:直流电机单双闭环调速系统仿真模型与参数优化设计报告
  • XSLT快速入门:XML转换全攻略
  • 【论文精读】CodeWMBench 揭示 AI 生成代码水印的残酷真相
  • AudioSeal Pixel Studio从零开始:Windows平台Anaconda环境完整配置流程
  • TB6612FNG直流电机驱动板原理图设计,已量产
  • 工业级隔离型RS485接口电路原理图设计,已量产
  • 孙珍妮AI形象生成镜像指南:Z-Image-Turbo LoRA模型安全加载与沙箱隔离配置
  • Cosmos-Reason1-7B企业应用:化工厂监控视频中识别泄漏源与扩散模拟建议
  • 探索COMSOL中的Merging off-gamma BIC计算
  • std::process::Command
  • 用M文件在Matlab 2019a中实现两电平三相SVPWM
  • 乐高兼容ESP32对讲机:模块化嵌入式音频通信设计
  • 旋转卡壳
  • 基于Simulink的固定频率滞环电流控制Boost变换器
  • 南北阁Nanbeige 4.1-3B行业方案:数据库课程设计智能辅导系统
  • HCIP第二次作业
  • YOLOv8训练Visidron小目标检测数据集及精度提升实践
  • Phi-4-reasoning-vision-15B应用场景:工业质检报告截图→缺陷类型/位置/等级三字段结构化
  • 南北阁 4.1-3B 部署案例:中小团队低成本构建私有化AI对话系统的落地路径
  • COMSOL 重现基于 THz 超构表面 BIC
  • AudioSeal Pixel Studio代码实例:Python调用PyTorch实现水印生成与识别
  • 手把手教你学Simulink——基于Simulink的主从式多机器人协同搬运控制仿真
  • 《创业之路》-904- 人间清醒:故事在开始时,结局就已注定——从“党指挥枪”到华为“力出一孔”,破解组织分裂的千年宿命
  • 类欧几里得
  • 零代码部署!Qwen3-VL-WEBUI镜像带你轻松玩转图像理解和对话
  • 刷题笔记:力扣第54、59题(螺旋矩阵)
  • Qwen2.5-VL-7B-Instruct新手入门:从安装到第一个图文对话