当前位置：首页 > news >正文

深度学习篇---YOLOv8n网络参数详细解析

news 2026/3/26 19:13:42

YOLOv8 网络参数详细解析

一、整体架构概览

这是一个YOLOv8n（Nano）模型的配置文件，具有129层，315万参数，计算量8.9 GFLOPS。

整体结构： ┌─────────────────┐ │ Input 640×640 │ ├─────────────────┤ │ │ │ Backbone │───► 特征提取（10层） │ │ ├─────────────────┤ │ │ │ Neck │───► 特征融合（12层） │ │ ├─────────────────┤ │ │ │ Head │───► 检测输出（1层） │ │ └─────────────────┘

二、参数详解

2.1 基本参数

nc: 80 # 检测类别数（COCO数据集80类） scales: n: [0.33, 0.25, 1024] # 深度因子, 宽度因子, 最大通道数

缩放参数含义：

深度因子 0.33：将基础模块的重复次数缩放为原来的0.33倍
宽度因子 0.25：将通道数缩放为原来的0.25倍
最大通道数 1024：通道数的上限

2.2 骨干网络（Backbone）解析

2.2.1 骨干网络结构表

序号	from	repeats	module	args	输出特征图	说明
0	-1	1	Conv	[64, 3, 2]	320×320×64	P1/2- 2倍下采样
1	-1	1	Conv	[128, 3, 2]	160×160×128	P2/4- 4倍下采样
2	-1	3	C2f	[128, True]	160×160×128	特征提取
3	-1	1	Conv	[256, 3, 2]	80×80×256	P3/8- 8倍下采样
4	-1	6	C2f	[256, True]	80×80×256	特征提取
5	-1	1	Conv	[512, 3, 2]	40×40×512	P4/16- 16倍下采样
6	-1	6	C2f	[512, True]	40×40×512	特征提取
7	-1	1	Conv	[1024, 3, 2]	20×20×1024	P5/32- 32倍下采样
8	-1	3	C2f	[1024, True]	20×20×1024	特征提取
9	-1	1	SPPF	[1024, 5]	20×20×1024	空间金字塔池化

2.2.2 关键模块说明

1. Conv模块：

# args: [输出通道, 卷积核大小, 步长] Conv(输入通道, 输出通道, 卷积核=3, 步长=2, padding=1)

2. C2f模块（改进的CSP结构）：

# args: [输出通道, shortcut] C2f(输入通道, 输出通道, n=重复次数, shortcut=True)

n=3/6：Bottleneck模块的重复次数
shortcut=True：使用残差连接
相比C3模块，C2f有更多的分支连接

3. SPPF模块（空间金字塔快速池化）：

# args: [输出通道, 池化核大小] SPPF(输入通道, 输出通道, k=5)

将输入分别通过5×5、5×5、5×5的最大池化
然后拼接结果，增加感受野

2.3 颈部网络（Neck）解析

2.3.1 颈部网络结构表

序号	from	repeats	module	args	输入来源	输出特征图	说明
10	-1	1	nn.Upsample	[None, 2, "nearest"]	层9	40×40×1024	2倍上采样
11	[-1, 6]	1	Concat	[1]	层10,6	40×40×1536	拼接P4特征
12	-1	3	C2f	[512]	层11	40×40×512	特征融合
13	-1	1	nn.Upsample	[None, 2, "nearest"]	层12	80×80×512	2倍上采样
14	[-1, 4]	1	Concat	[1]	层13,4	80×80×768	拼接P3特征
15	-1	3	C2f	[256]	层14	80×80×256	P3/8输出
16	-1	1	Conv	[256, 3, 2]	层15	40×40×256	下采样
17	[-1, 12]	1	Concat	[1]	层16,12	40×40×768	拼接中间特征
18	-1	3	C2f	[512]	层17	40×40×512	P4/16输出
19	-1	1	Conv	[512, 3, 2]	层18	20×20×512	下采样
20	[-1, 9]	1	Concat	[1]	层19,9	20×20×1536	拼接P5特征
21	-1	3	C2f	[1024]	层20	20×20×1024	P5/32输出

2.3.2 特征金字塔结构（FPN+PAN）

[骨干网络] │ P5: 20×20×1024 │ SPPF(层9) │ ┌──────┴──────┐ │ │ Upsample 保留P5 (2倍上采样) │ │ │ Concat(P4) │ (层11: 40×40×1536) │ │ │ C2f(层12) │ (40×40×512) │ │ │ ┌───┴──────┐ │ │ │ │ Upsample 保留P4 │ (2倍上采样) (40×40×512) │ │ │ │ Concat(P3) │ │ (层14: 80×80×768) │ │ │ │ │ C2f(层15) │ │ (80×80×256)───┐ │ │ │ │ │ │ Conv下采样 │ │ │ (层16: 40×40×256) │ │ │ │ │ │ Concat(层12) │ │ (层17: 40×40×768) │ │ │ │ │ │ C2f(层18) │ │ (40×40×512)───┐ │ │ │ │ │ │ Conv下采样 │ │ │ (层19: 20×20×512) │ │ │ │ │ │ Concat(层9) │ │ (层20: 20×20×1536)│ │ │ │ │ │ C2f(层21) │ │ (20×20×1024) │ │ │ │ │ └──────────┴──────┘ │ Detect(层22) [P3, P4, P5 三尺度检测]

2.4 检测头（Head）

- [[15, 18, 21], 1, Detect, [nc]] # 检测层

Detect模块参数：

输入：[层15, 层18, 层21]三个尺度的特征图
输出：每个尺度预测框的位置、置信度、类别

三尺度检测：

P3/8（层15）：80×80分辨率 → 检测小目标
- 高分辨率，细节丰富
- 适合小物体检测
P4/16（层18）：40×40分辨率 → 检测中目标
- 中等分辨率
- 平衡细节和语义信息
P5/32（层21）：20×20分辨率 → 检测大目标
- 低分辨率，语义信息强
- 适合大物体检测

三、特征图维度变化

假设输入图像为640×640×3：

阶段 层数 操作 输出维度 下采样倍数 -------------------------------------------------------------------- 输入 - - 640×640×3 1x P1/2 0 Conv, stride=2 320×320×64 2x P2/4 1 Conv, stride=2 160×160×128 4x 2 C2f×3 160×160×128 4x P3/8 3 Conv, stride=2 80×80×256 8x 4 C2f×6 80×80×256 8x P4/16 5 Conv, stride=2 40×40×512 16x 6 C2f×6 40×40×512 16x P5/32 7 Conv, stride=2 20×20×1024 32x 8 C2f×3 20×20×1024 32x 9 SPPF 20×20×1024 32x -------------------------------------------------------------------- Neck 10 Upsample×2 40×40×1024 16x 11 Concat(P4) 40×40×1536 16x 12 C2f×3 40×40×512 16x 13 Upsample×2 80×80×512 8x 14 Concat(P3) 80×80×768 8x 15 C2f×3 80×80×256 8x ← P3输出 16 Conv, stride=2 40×40×256 16x 17 Concat(层12) 40×40×768 16x 18 C2f×3 40×40×512 16x ← P4输出 19 Conv, stride=2 20×20×512 32x 20 Concat(层9) 20×20×1536 32x 21 C2f×3 20×20×1024 32x ← P5输出

四、计算量分析

4.1 参数分布

总参数: 3,157,200 ├── 骨干网络: ~45% ├── 颈部网络: ~50% └── 检测头: ~5%

4.2 计算复杂度

总计算量: 8.9 GFLOPS 骨干网络主要计算层： 1. 层4 (C2f×6): ~1.2 GFLOPS 2. 层6 (C2f×6): ~2.4 GFLOPS 3. 层8 (C2f×3): ~2.0 GFLOPS

五、设计特点

5.1 创新点

C2f模块：代替C3，更多的跨层连接
SPPF代替SPP：计算效率更高
解耦头：分类和回归任务分离（在Detect内部实现）
Anchor-Free：不需要预设锚框

5.2 性能优势

多尺度检测：P3/8, P4/16, P5/32三个尺度
特征融合充分：FPN+PAN结构，双向特征金字塔
计算效率高：深度可分离卷积、轻量级设计

5.3 适用场景

小目标检测：关注P3/8输出
实时检测：8.9 GFLOPS适合移动端
通用检测：平衡速度与精度

查看全文

http://www.jsqmd.com/news/313882/

救命神器8个AI论文写作软件，本科生轻松搞定毕业论文！

0128充满[特殊字符]的一天

厦门装修找哪家？2026年1月最新十大品牌全解析

微信小程序开发的价格一览表！列出明细

AI写毕业论文工具评测：9款一键极速生成神器，轻松搞定超长篇幅论文！

2026年停车场道闸厂家权威推荐榜单，基于技术实力的深度测评

瑞克

深圳地区的小程序开发公司有哪些？这里帮你总结测评

微信小程序的搭建教程：用对工具平台，几天就能上线！

AI伦理设计的未来趋势：AI应用架构师必须关注的5个方向（预测）

SpringMVC框架和Spring框架

在上海的小程序开发公司怎么选：实用挑选指南帮你避坑

【微电网】【创新点】基于非支配排序的蜣螂优化算法NSDBO求解微电网多目标优化调度研究附Matlab代码

【无功功率控制】连接到无限电网的小型风电场的无功功率控制附Simulink仿真

路由全局守卫

【Python踩坑全记录】-pip install xxx 命令安装的，在电脑的哪个盘？

当噪声成为护盾：安全通信中二项分布随机噪声的概率分析与统计特性

【无人机】无人机在时变风下跟随策略的路径模拟附Matlab代码

从概念到落地：企业AI架构评估体系的8个实施阶段

【无人机】【基于多段杜宾斯Dubins路径的协同路径规划】复杂威胁环境下的多无人机协同路径规划研究附Matlab代码

广东地区的小程序开发公司大盘点：TOP5实力品牌帮你精准选择

【无人机】密集城市环境中无人机空对地对地（U2G）路径损耗研究附Matlab代码

详细介绍：MySQL 学习笔记（进阶篇2）

【无人机】无人机群在三维环境中的碰撞和静态避障仿真附Matlab代码

数据结构：（二）逻辑之门——栈与队列

【MCU控制初级手札】1.3 价电子、净电荷【化学基础】 - 指南

EOM（Enterprise Operating Model企业经营模型）七大要素的界定（之一）--SMP（软件制作平台）语言基础知识之四十七

【无功优化】电网故障下分布式能源系统多目标优化[并网转换器（GCC）]附Matlab代码Simulink

【无迹卡尔曼滤波】不确定和间接测量的非线性动力系统识别研究附Matlab代码