当前位置: 首页 > news >正文

YOLO入门

YOLO入门:从推理到训练(完整版)

前提准备

下载ultralytics源代码和官方训练好的对应版本模型Assets(放在新建文件夹deeplearning里)

一、核心概念:推理 vs 训练

在开始操作前,先理解两个最核心的概念
1.推理使用别人训练好的模型,输入一张图片,模型告诉你图里有什么 。
2.训练准备大量图片和人工标注的正确答案,喂给模型,让模型自己调整参数 。

3.简单总结

· 推理 = 使用模型
· 训练 = 获取模型

学习YOLO,本质上就是解决推理与训练过程中遇到的各种问题。

二、YOLO推理入门:使用现成模型

1. 推理流程
图片/视频 → 传入模型 → 模型输出检测结果(类别+位置)

模型自带一些参数(如输入尺寸等),这些参数会影响预测结果。

2. 实战

3. 预测目标(source)的多种形式

实际操作小技巧:

· 想预测文件夹中某一张照片:复制完整路径(带完整后缀的文件名)
· 想预测整个文件夹:复制文件夹路径
· 预测结果默认保存在runs/detect/predictN/(N是数字)
· 如果只想快速查看结果,设置show=True,可以不用保存(save=False)

·摄像头source= 0 调用电脑摄像头实时检测

· 视频太长不想等:可以提前终止,或右击预测结果文件夹,打开资源管理器直接查看已生成的部分
· 摄像头占用内存大:source=0会持续占用摄像头,注意释放

4.认识模型

模型任务类型:明确模型具体解决什么问题,涵盖目标检测、旋转目标检测、姿态估计、实例分割、图像分类等主流计算机视觉任务。

模型可预测的类型:即模型能识别的目标类别,以YOLO11为例,其支持识别80种常见目标类型(如person、bicycle、car等日常常见物体)。

模型的大小:模型体积(参数规模、文件大小)是其性能与部署成本的关键指标。参数越多,训练越准确,但耗时越久。

下载好的模型记得放到源代码ultralytics里。

5.预测选项(…预测的时候能不能提一些要求?)

- 官方Inference Sources:

Inference arguments 推理参数

Visualization arguments 可视化参数

-例如:line_width=8,预测的时候把线画粗一些

三、YOLO训练入门:获取自己的模型

当你想要模型识别自己定义的物体(比如工厂零件、特定动物)时,就需要训练自己的模型。

1. 训练的核心三要素

*数据集图片 + 人工标注的正确答案 标注要准确,数量要足够
*模型结构YOLO的网络架构 可选n/s/m/l/x不同大小
*训练策略学习率、轮数、批次大小等 影响模型收敛速度和效果

训练的本质:

准备大量图片和人工标注的正确答案 → 喂给模型 → 每喂一次,模型就更新一次参数 → 模型预测结果越来越准确

2. 数据集准备

目录结构(推荐)

```
datasets/
├── images/
│ ├── train/ # 训练集图片
│ └── val/ # 验证集图片
└── labels/
├── train/ # 训练集标注文件(与图片同名.txt)
└── val/ # 验证集标注文件
```

数据集配置文件(.yaml)

```yaml
path: ../datasets/mydata # 数据集根目录
train: images/train # 训练图片相对路径
val: images/val # 验证图片相对路径

nc: 2 # 类别数量
names: ['cat', 'dog'] # 类别名称
```

3. 跑通训练命令(YOLOv8示例)

```bash
yolo train data=mydata.yaml model=yolov8n.pt epochs=100 batch=16 imgsz=640
```

关键参数:
data数据集配置文件 必须正确指向
model预训练权重 推荐使用yolov8n.pt(迁移学习)
epochs训练轮数 初期50-100轮
batch批次大小 根据显存调整,通常16-64
imgsz输入图片尺寸 与数据集一致,默认640

四、推理与训练的完整闭环

```
┌─────────────────────────────────────────────────────┐
│ 训练阶段 │
│ 大量图片 + 人工标注 → 训练 → 得到专属权重(.pt) │
└─────────────────────────────────────────────────────┘

┌─────────────────────────────────────────────────────┐
│ 推理阶段 │
│ 新图片 → 加载权重 → 预测 → 输出检测结果 │
└─────────────────────────────────────────────────────┘
```

学习AI的过程:就是解决推理与训练过程中遇到的各种问题——环境配置、数据集标注、参数调优、模型部署等。

五、总结
推理 使用现成模型检测 model.predict(source="...") 标注后的图片/视频
训练 训练专属模型 yolo train data=xxx.yaml 专属权重文件

建议学习路径:

1. 先跑通推理,体验效果
2. 准备小规模自定义数据集(2-3类,每类50-100张)
3. 跑通训练,观察指标变化
4. 用训练好的模型推理,感受差异
5. 逐步扩大数据,优化效果

http://www.jsqmd.com/news/539692/

相关文章:

  • 流式液相检测技术(CBA)研究进展
  • 做小月子要注意什么?科学修护指南
  • C++基础笔记(7):拷贝构造函数
  • 函数式编程的架构目标
  • 2026SAT精品小班辅导机构怎么选?高分备考优质SAT小班机构测评 - 品牌2026
  • 纯手工搭建:基于Matlab/Simulink的增程式混合动力汽车建模仿真模型教程
  • 【笔记】用cursor手搓cursor(三)简单尝试claude code
  • 开发者效率周刊 #01
  • 基于 Matlab 的球轴承拟静力学计算:探索不同参数下的生热量
  • 2026年3月广州装饰装修公司选择指南:办公室装修,厂房装修,商铺装修,酒店装修,会所装修,林迪装饰深耕工装领域的专业服务提供商 - 海棠依旧大
  • 2026年四川免砸砖维修厂家哪家强 精准找漏长效修复适配多场景需求 - 深度智识库
  • RVC语音转换精度评测:MOS分对比、频谱图相似度、F0曲线拟合效果
  • 西门子1500PLC饮料罐装线:从代码到螺丝刀的全栈开发实录
  • 大车相撞事故道路交通事故快速勘查系统厂商哪家好?安全高效优先 - 品牌2026
  • Ubuntu 安装完成后网络配置教程
  • DMXAPI 下的 PostgreSQL MCP Tool 使用笔记:少一点幻想,多一点可审计的能力
  • Gemini 3 Pro在学术写作中的全流程应用
  • Jmeter 内置的 python 版本
  • Git-RSCLIP在嵌入式系统中的应用:基于STM32的轻量级部署
  • 2026年3月山东护栏厂家选择指南:不锈钢复合管,不锈钢栏杆,护栏,桥梁护栏,河道护栏,山东绿洲护栏深耕行业的专业护栏服务商 - 海棠依旧大
  • 别再只调电位器了!用Arduino+光耦MOC3061玩转双向可控硅的零位控制(附完整代码)
  • OpenClaw学术伦理应用:Qwen3-32B本地化处理心理学实验数据
  • 基于Matlab的Tamura纹理特征提取
  • 灰狼算法优化的LSSVR程序
  • AT_arc216_c [ARC216C] Count Power of 2
  • UI/UX 设计原则:从美学到体验的完美融合
  • 磁力搜索终极指南:10分钟掌握开源聚合搜索工具magnetW
  • 2026年泉州榻榻米定制厂家推荐:衣帽间定制/橱柜定制/衣柜定制/玄关柜定制/酒柜定制一站式服务商精选 - 品牌推荐官
  • Nginx 抢跑导致的 Docker 服务“全线雪崩
  • 24小时响应+全流程托管:甘肃殡葬服务“一站式”标杆的实力答卷 - 深度智识库