当前位置：首页 > news >正文

yolo模型微调训练

news 2026/6/16 4:03:14

一、训练脚本

from ultralytics import YOLO def main(): model = YOLO("yolo26n.pt") model.train( data="E:/vision_code/yolo_wt/data/data.yaml", imgsz=640, epochs=100, batch=15, device=0, workers=0, save_period=10 ) if __name__ == "__main__": main()

二、训练参数含义

参数	示例	含义	建议
`model`	`yolo26n.pt`	训练基座模型	310B 部署优先`n`或`s`
`data`	`data.yaml`	数据集配置文件	指向 Roboflow 导出的`data.yaml`
`epochs`	`100`	训练轮数	先用`50-100`
`batch`	`4`	每批训练图片数量	4GB 显存建议`2-4`
`imgsz`	`640`	输入图片尺寸	通用用`640`
`device`	`0`	训练设备	GPU 用`0`，CPU 用`cpu`
`workers`	`0`	数据加载线程数	Windows 建议`0`
`optimizer`	`auto`	优化器	新手用`auto`
`lr0`	`0.001`	初始学习率	微调可用`0.001`，也可默认
`patience`	`30`	早停等待轮数	`20-50`
`save`	`True`	是否保存训练结果	默认保存
`save_period`	`10`	每隔多少轮保存一次权重	想保留中间模型用`10`
`project`	`runs/detect`	训练结果保存目录	可自定义
`name`	`helmet_yolo26n`	本次训练名称	方便区分实验
`exist_ok`	`True`	是否允许覆盖同名目录	不想覆盖就用`False`
`pretrained`	`True`	是否加载预训练权重	微调建议`True`
`resume`	`False`	是否从中断处继续训练	中断后可用`True`
`amp`	`True`	自动混合精度训练	GPU 训练建议开启
`cache`	`False`	是否缓存图片到内存/磁盘	内存够可用`disk`
`seed`	`0`	随机种子	复现实验用
`verbose`	`True`	是否输出详细日志	默认即可

三、输出参数含义

字段	含义	怎么看
`GPU_mem`	当前训练占用的 GPU 显存	越低越省显存
`box_loss`	框的位置损失，越低说明预测框越接近真实框	越低越好
`cls_loss`	类别损失，越低说明分类越准	越低越好
`dfl_loss`	边框分布损失，辅助定位，越低越好	越低越好
`Instances`	当前 batch 中目标框数量	表示这一批图片里有几个标注目标
`Size`	输入图片尺寸	你设置的是`640`
`71/137`	当前 epoch 内 batch 进度	共 137 个 batch，当前第 71 个
`4.1it/s`	每秒处理多少个 batch	越高训练越快
`20.1s<16.0s`	已用时间/预计剩余时间	进度条时间信息

四、TensorBoard 查看 YOLO 训练过程

1. 安装 TensorBoard

pip install -U tensorboard

确认能启动：

tensorboard --version

2. 开启 Ultralytics 的 TensorBoard 日志

查看当前设置：

yolo settings

如果看到：

tensorboard: False

执行：

yolo settings tensorboard=True

再次确认：

yolo settings

确保是：

tensorboard: True

3. 开始训练

命令行训练示例：

yolo detect train model=yolo26n.pt data=E:/vision_code/yolo_wt/data/data.yaml imgsz=640 epochs=50 batch=4 device=0 workers=0 project=E:/vision_code/yolo_wt/train_wt/runs name=helmet_yolo26n

Python 脚本训练示例：

from ultralytics import YOLO def main(): model = YOLO("yolo26n.pt") model.train( data="E:/vision_code/yolo_wt/data/data.yaml", imgsz=640, epochs=50, batch=4, device=0, workers=0, project="E:/vision_code/yolo_wt/train_wt/runs", name="helmet_yolo26n", plots=True, ) if __name__ == "__main__": main()

4. 确认是否生成 TensorBoard 日志

训练开始后或训练结束后，执行：

Get-ChildItem -Recurse E:\vision_code\yolo_wt\train_wt\runs -Filter "events.out.tfevents*"

如果能看到类似：

events.out.tfevents.171xxxx

说明 TensorBoard 日志生成成功。

5. 启动 TensorBoard

推荐指向总的runs目录：

tensorboard --logdir E:\vision_code\yolo_wt\train_wt\runs

如果只想看某一次训练：

tensorboard --logdir E:\vision_code\yolo_wt\train_wt\runs\helmet_yolo26n

浏览器打开：

http://localhost:6006

6. 在 TensorBoard 里看什么

主要看Scalars页面：

曲线	含义	趋势
`train/box_loss`	训练集框回归损失	越低越好
`train/cls_loss`	训练集分类损失	越低越好
`train/dfl_loss`	框定位细节损失	越低越好
`val/box_loss`	验证集框损失	越低越好
`val/cls_loss`	验证集分类损失	越低越好
`metrics/precision`	准确率，误检少不少	越高越好
`metrics/recall`	召回率，漏检少不少	越高越好
`metrics/mAP50`	宽松检测精度	越高越好
`metrics/mAP50-95`	严格综合检测精度	越高越好