当前位置：首页 > news >正文

YOLO入门

news 2026/6/30 18:38:15

YOLO入门：从推理到训练（完整版）

前提准备

下载ultralytics源代码和官方训练好的对应版本模型Assets(放在新建文件夹deeplearning里)

一、核心概念：推理 vs 训练

在开始操作前，先理解两个最核心的概念：
1.推理使用别人训练好的模型，输入一张图片，模型告诉你图里有什么。
2.训练准备大量图片和人工标注的正确答案，喂给模型，让模型自己调整参数。

3.简单总结：

· 推理 = 使用模型
· 训练 = 获取模型

学习YOLO，本质上就是解决推理与训练过程中遇到的各种问题。

二、YOLO推理入门：使用现成模型

1. 推理流程
图片/视频 → 传入模型 → 模型输出检测结果（类别+位置）

模型自带一些参数（如输入尺寸等），这些参数会影响预测结果。

2. 实战

3. 预测目标（source）的多种形式

实际操作小技巧：

· 想预测文件夹中某一张照片：复制完整路径（带完整后缀的文件名）
· 想预测整个文件夹：复制文件夹路径
· 预测结果默认保存在runs/detect/predictN/（N是数字）
· 如果只想快速查看结果，设置show=True，可以不用保存（save=False）

·摄像头source= 0 调用电脑摄像头实时检测

· 视频太长不想等：可以提前终止，或右击预测结果文件夹，打开资源管理器直接查看已生成的部分
· 摄像头占用内存大：source=0会持续占用摄像头，注意释放

4.认识模型

模型任务类型：明确模型具体解决什么问题，涵盖目标检测、旋转目标检测、姿态估计、实例分割、图像分类等主流计算机视觉任务。

模型可预测的类型：即模型能识别的目标类别，以YOLO11为例，其支持识别80种常见目标类型（如person、bicycle、car等日常常见物体）。

模型的大小：模型体积（参数规模、文件大小）是其性能与部署成本的关键指标。参数越多，训练越准确，但耗时越久。

下载好的模型记得放到源代码ultralytics里。

5.预测选项(…预测的时候能不能提一些要求？)

- 官方Inference Sources：

Inference arguments 推理参数

Visualization arguments 可视化参数

-例如：line_width=8，预测的时候把线画粗一些

三、YOLO训练入门：获取自己的模型

当你想要模型识别自己定义的物体（比如工厂零件、特定动物）时，就需要训练自己的模型。

1. 训练的核心三要素

*数据集图片 + 人工标注的正确答案标注要准确，数量要足够
*模型结构YOLO的网络架构可选n/s/m/l/x不同大小
*训练策略学习率、轮数、批次大小等影响模型收敛速度和效果

训练的本质：

准备大量图片和人工标注的正确答案 → 喂给模型 → 每喂一次，模型就更新一次参数 → 模型预测结果越来越准确

2. 数据集准备

目录结构（推荐）

```
datasets/
├── images/
│ ├── train/ # 训练集图片
│ └── val/ # 验证集图片
└── labels/
├── train/ # 训练集标注文件（与图片同名.txt）
└── val/ # 验证集标注文件
```

数据集配置文件（.yaml）

```yaml
path: ../datasets/mydata # 数据集根目录
train: images/train # 训练图片相对路径
val: images/val # 验证图片相对路径

nc: 2 # 类别数量
names: ['cat', 'dog'] # 类别名称
```

3. 跑通训练命令（YOLOv8示例）

```bash
yolo train data=mydata.yaml model=yolov8n.pt epochs=100 batch=16 imgsz=640
```

关键参数：
data数据集配置文件必须正确指向
model预训练权重推荐使用yolov8n.pt（迁移学习）
epochs训练轮数初期50-100轮
batch批次大小根据显存调整，通常16-64
imgsz输入图片尺寸与数据集一致，默认640

四、推理与训练的完整闭环

```
┌─────────────────────────────────────────────────────┐
│ 训练阶段 │
│ 大量图片 + 人工标注 → 训练 → 得到专属权重(.pt) │
└─────────────────────────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────┐
│ 推理阶段 │
│ 新图片 → 加载权重 → 预测 → 输出检测结果 │
└─────────────────────────────────────────────────────┘
```

学习AI的过程：就是解决推理与训练过程中遇到的各种问题——环境配置、数据集标注、参数调优、模型部署等。

五、总结
推理使用现成模型检测 model.predict(source="...") 标注后的图片/视频
训练训练专属模型 yolo train data=xxx.yaml 专属权重文件

建议学习路径：

1. 先跑通推理，体验效果
2. 准备小规模自定义数据集（2-3类，每类50-100张）
3. 跑通训练，观察指标变化
4. 用训练好的模型推理，感受差异
5. 逐步扩大数据，优化效果

查看全文

http://www.jsqmd.com/news/539692/