当前位置: 首页 > news >正文

深度学习篇---YOLOv8n网络参数详细解析

YOLOv8 网络参数详细解析

一、整体架构概览

这是一个YOLOv8n(Nano)模型的配置文件,具有129层315万参数,计算量8.9 GFLOPS

整体结构: ┌─────────────────┐ │ Input 640×640 │ ├─────────────────┤ │ │ │ Backbone │───► 特征提取(10层) │ │ ├─────────────────┤ │ │ │ Neck │───► 特征融合(12层) │ │ ├─────────────────┤ │ │ │ Head │───► 检测输出(1层) │ │ └─────────────────┘

二、参数详解

2.1 基本参数

nc: 80 # 检测类别数(COCO数据集80类) scales: n: [0.33, 0.25, 1024] # 深度因子, 宽度因子, 最大通道数

缩放参数含义

  • 深度因子 0.33:将基础模块的重复次数缩放为原来的0.33倍

  • 宽度因子 0.25:将通道数缩放为原来的0.25倍

  • 最大通道数 1024:通道数的上限

2.2 骨干网络(Backbone)解析

2.2.1 骨干网络结构表
序号fromrepeatsmoduleargs输出特征图说明
0-11Conv[64, 3, 2]320×320×64P1/2- 2倍下采样
1-11Conv[128, 3, 2]160×160×128P2/4- 4倍下采样
2-13C2f[128, True]160×160×128特征提取
3-11Conv[256, 3, 2]80×80×256P3/8- 8倍下采样
4-16C2f[256, True]80×80×256特征提取
5-11Conv[512, 3, 2]40×40×512P4/16- 16倍下采样
6-16C2f[512, True]40×40×512特征提取
7-11Conv[1024, 3, 2]20×20×1024P5/32- 32倍下采样
8-13C2f[1024, True]20×20×1024特征提取
9-11SPPF[1024, 5]20×20×1024空间金字塔池化
2.2.2 关键模块说明

1. Conv模块

# args: [输出通道, 卷积核大小, 步长] Conv(输入通道, 输出通道, 卷积核=3, 步长=2, padding=1)

2. C2f模块(改进的CSP结构):

# args: [输出通道, shortcut] C2f(输入通道, 输出通道, n=重复次数, shortcut=True)
  • n=3/6:Bottleneck模块的重复次数

  • shortcut=True:使用残差连接

  • 相比C3模块,C2f有更多的分支连接

3. SPPF模块(空间金字塔快速池化):

# args: [输出通道, 池化核大小] SPPF(输入通道, 输出通道, k=5)
  • 将输入分别通过5×5、5×5、5×5的最大池化

  • 然后拼接结果,增加感受野

2.3 颈部网络(Neck)解析

2.3.1 颈部网络结构表
序号fromrepeatsmoduleargs输入来源输出特征图说明
10-11nn.Upsample[None, 2, "nearest"]层940×40×10242倍上采样
11[-1, 6]1Concat[1]层10,640×40×1536拼接P4特征
12-13C2f[512]层1140×40×512特征融合
13-11nn.Upsample[None, 2, "nearest"]层1280×80×5122倍上采样
14[-1, 4]1Concat[1]层13,480×80×768拼接P3特征
15-13C2f[256]层1480×80×256P3/8输出
16-11Conv[256, 3, 2]层1540×40×256下采样
17[-1, 12]1Concat[1]层16,1240×40×768拼接中间特征
18-13C2f[512]层1740×40×512P4/16输出
19-11Conv[512, 3, 2]层1820×20×512下采样
20[-1, 9]1Concat[1]层19,920×20×1536拼接P5特征
21-13C2f[1024]层2020×20×1024P5/32输出
2.3.2 特征金字塔结构(FPN+PAN)
[骨干网络] │ P5: 20×20×1024 │ SPPF(层9) │ ┌──────┴──────┐ │ │ Upsample 保留P5 (2倍上采样) │ │ │ Concat(P4) │ (层11: 40×40×1536) │ │ │ C2f(层12) │ (40×40×512) │ │ │ ┌───┴──────┐ │ │ │ │ Upsample 保留P4 │ (2倍上采样) (40×40×512) │ │ │ │ Concat(P3) │ │ (层14: 80×80×768) │ │ │ │ │ C2f(层15) │ │ (80×80×256)───┐ │ │ │ │ │ │ Conv下采样 │ │ │ (层16: 40×40×256) │ │ │ │ │ │ Concat(层12) │ │ (层17: 40×40×768) │ │ │ │ │ │ C2f(层18) │ │ (40×40×512)───┐ │ │ │ │ │ │ Conv下采样 │ │ │ (层19: 20×20×512) │ │ │ │ │ │ Concat(层9) │ │ (层20: 20×20×1536)│ │ │ │ │ │ C2f(层21) │ │ (20×20×1024) │ │ │ │ │ └──────────┴──────┘ │ Detect(层22) [P3, P4, P5 三尺度检测]

2.4 检测头(Head)

- [[15, 18, 21], 1, Detect, [nc]] # 检测层

Detect模块参数

  • 输入:[层15, 层18, 层21]三个尺度的特征图

  • 输出:每个尺度预测框的位置、置信度、类别

三尺度检测

  1. P3/8(层15):80×80分辨率 → 检测小目标

    • 高分辨率,细节丰富

    • 适合小物体检测

  2. P4/16(层18):40×40分辨率 → 检测中目标

    • 中等分辨率

    • 平衡细节和语义信息

  3. P5/32(层21):20×20分辨率 → 检测大目标

    • 低分辨率,语义信息强

    • 适合大物体检测

三、特征图维度变化

假设输入图像为640×640×3

阶段 层数 操作 输出维度 下采样倍数 -------------------------------------------------------------------- 输入 - - 640×640×3 1x P1/2 0 Conv, stride=2 320×320×64 2x P2/4 1 Conv, stride=2 160×160×128 4x 2 C2f×3 160×160×128 4x P3/8 3 Conv, stride=2 80×80×256 8x 4 C2f×6 80×80×256 8x P4/16 5 Conv, stride=2 40×40×512 16x 6 C2f×6 40×40×512 16x P5/32 7 Conv, stride=2 20×20×1024 32x 8 C2f×3 20×20×1024 32x 9 SPPF 20×20×1024 32x -------------------------------------------------------------------- Neck 10 Upsample×2 40×40×1024 16x 11 Concat(P4) 40×40×1536 16x 12 C2f×3 40×40×512 16x 13 Upsample×2 80×80×512 8x 14 Concat(P3) 80×80×768 8x 15 C2f×3 80×80×256 8x ← P3输出 16 Conv, stride=2 40×40×256 16x 17 Concat(层12) 40×40×768 16x 18 C2f×3 40×40×512 16x ← P4输出 19 Conv, stride=2 20×20×512 32x 20 Concat(层9) 20×20×1536 32x 21 C2f×3 20×20×1024 32x ← P5输出

四、计算量分析

4.1 参数分布

总参数: 3,157,200 ├── 骨干网络: ~45% ├── 颈部网络: ~50% └── 检测头: ~5%

4.2 计算复杂度

总计算量: 8.9 GFLOPS 骨干网络主要计算层: 1. 层4 (C2f×6): ~1.2 GFLOPS 2. 层6 (C2f×6): ~2.4 GFLOPS 3. 层8 (C2f×3): ~2.0 GFLOPS

五、设计特点

5.1 创新点

  1. C2f模块:代替C3,更多的跨层连接

  2. SPPF代替SPP:计算效率更高

  3. 解耦头:分类和回归任务分离(在Detect内部实现)

  4. Anchor-Free:不需要预设锚框

5.2 性能优势

  1. 多尺度检测:P3/8, P4/16, P5/32三个尺度

  2. 特征融合充分:FPN+PAN结构,双向特征金字塔

  3. 计算效率高:深度可分离卷积、轻量级设计

5.3 适用场景

  • 小目标检测:关注P3/8输出

  • 实时检测:8.9 GFLOPS适合移动端

  • 通用检测:平衡速度与精度

http://www.jsqmd.com/news/313882/

相关文章:

  • 救命神器8个AI论文写作软件,本科生轻松搞定毕业论文!
  • 0128充满[特殊字符]的一天
  • 厦门装修找哪家?2026年1月最新十大品牌全解析
  • 微信小程序开发的价格一览表!列出明细
  • AI写毕业论文工具评测:9款一键极速生成神器,轻松搞定超长篇幅论文!
  • 2026年停车场道闸厂家权威推荐榜单,基于技术实力的深度测评
  • 瑞克
  • 深圳地区的小程序开发公司有哪些?这里帮你总结测评
  • 微信小程序的搭建教程:用对工具平台,几天就能上线!
  • AI伦理设计的未来趋势:AI应用架构师必须关注的5个方向(预测)
  • SpringMVC框架和Spring框架
  • 在上海的小程序开发公司怎么选:实用挑选指南帮你避坑
  • 【微电网】【创新点】基于非支配排序的蜣螂优化算法NSDBO求解微电网多目标优化调度研究附Matlab代码
  • 【无功功率控制】连接到无限电网的小型风电场的无功功率控制附Simulink仿真
  • 路由全局守卫
  • 【游戏推荐】全球鱼友俱乐部:放置好时光 (Tiny Aquarium Social Fishkeeping)免安装中文版
  • 【Python踩坑全记录】-pip install xxx 命令安装的 ,在电脑的哪个盘?
  • 当噪声成为护盾:安全通信中二项分布随机噪声的概率分析与统计特性
  • 【无人机】无人机在时变风下跟随策略的路径模拟附Matlab代码
  • 从概念到落地:企业AI架构评估体系的8个实施阶段
  • 【无人机】【基于多段杜宾斯Dubins路径的协同路径规划】复杂威胁环境下的多无人机协同路径规划研究附Matlab代码
  • 广东地区的小程序开发公司大盘点:TOP5实力品牌帮你精准选择
  • 【无人机】密集城市环境中无人机空对地对地 (U2G) 路径损耗研究附Matlab代码
  • 详细介绍:MySQL 学习笔记(进阶篇2)
  • 【无人机】无人机群在三维环境中的碰撞和静态避障仿真附Matlab代码
  • 数据结构:(二)逻辑之门——栈与队列
  • 【MCU控制 初级手札】1.3 价电子、净电荷 【化学基础】 - 指南
  • EOM(Enterprise Operating Model企业经营模型)七大要素的界定(之一)--SMP(软件制作平台)语言基础知识之四十七
  • 【无功优化】电网故障下分布式能源系统多目标优化[并网转换器(GCC)]附Matlab代码Simulink
  • 【无迹卡尔曼滤波】不确定和间接测量的非线性动力系统识别研究附Matlab代码