当前位置：首页 > news >正文

07.训练自己的数据集（上）：标注与格式准备

news 2026/6/23 7:07:05

从本篇开始，我们将正式进入YOLO的核心操作环节——训练自己的数据集。在之前的篇目中，你已了解了YOLO的基本原理、环境搭建以及如何使用预训练模型进行目标检测。但真正让YOLO为你工作的关键，是让它学会识别你关心的特定目标。这需要你提供一批标注好的图片，让模型从中学习。训练自己的数据集是一个系统工程，本篇先聚焦最基础也最关键的步骤：数据标注与格式准备。

首先，明确一个核心概念：YOLO需要什么样的数据？YOLO使用一种特定的标注格式，称为“归一化坐标格式”。对于每张图片，你需要提供一个同名的.txt文本文件，文件中的每一行对应一个目标。每行包含五个数字：类别ID、目标中心点的x坐标、中心点的y坐标、目标宽度、目标高度。这四个坐标值不是像素值，而是相对于图片宽度和高度的比例，取值范围在0到1之间。例如，一张640x480的图片，如果某个目标的中心点在像素坐标(320, 240)，宽度为160像素，高度为120像素，那么对应的归一化坐标就是：0.5 (320/640)，0.5 (240/480)，0.25 (160/640)，0.25 (120/480)。如果图片中有多个目标，就在文本文件中写多行。

接下来，你需要准备一个数据集目录结构。通常YOLO项目会要求你将图片和标注文件分别放在两个文件夹中，比如images和labels。并且一般还会划分训练集和验证集。一个常见的结构是：
dataset/
images/
train/
img001.jpg
img002.jpg
val/
img100.jpg
labels/
train/
img001.txt
img002.txt
val/
img100.txt

注意：标注文件的

http://www.jsqmd.com/news/706315/

相关文章：

Agent 安全性红队测试：如何防止 Prompt Injection 攻击你的智能体？

基于RAG的ChatGPT文件检索工具：从原理到实践

基于LangGraph的多智能体AI内容生成系统XunLong实战指南

智能体的情景记忆

NLP文本表示方法对比：词袋、TF-IDF与LLM嵌入

昨天晚上口头发表政治评论马桶提示:6 d 心

深度学习实践

React Fiber 异步渲染原理讲解

计算机视觉中图像数据预处理与增强技术详解

为什么 Markdown 是大模型更优雅的对话格式？

低功耗IoT自动调制识别：轻量特征+微型神经网络，一文吃透核心理论【附python代码】

GOSIM Spotlight 2026 Frontier Creators入围作品正式官宣！

Bridgic：轻量级数据集成平台的设计、实践与避坑指南

「一文搞懂 Material Design：Toolbar 到 CollapsingToolbar 全攻略」

nli-MiniLM2-L6-H768在软件测试中的应用：自动化生成测试用例与断言

MAF快速入门（）给Agent Skill添加脚本执行能力

C++面试题自用-持续更新

Save Image as Type终极指南：如何在Chrome中一键转换图片格式

Java开发者如何用LangChain4j构建企业级AI应用：从RAG到智能体

基于T5模型的多语言翻译系统实战指南

机器学习数据准备框架：提升模型效果的工程实践

2026诚信入境旅游服务标杆名录：大陆居民赴台旅游/探险旅游/研学旅行定制/私人高端旅游定制/考古旅游/自驾游/选择指南 - 优质品牌商家

2026中水处理设备标杆名录：安徽污水处理设备厂家/工业废水处理设备/废水处理处理设备/气浮机一体化污水处理设备/选择指南 - 优质品牌商家

VM图像处理（1、图像二值化和图像滤波，Sobel提取过程）

企业境外投资备案ODI常见问题解答：深圳境外投资备案ODI/美国公司注册/越南公司注册/马达加斯加公司注册/上海境外投资备案ODI/选择指南 - 优质品牌商家

时间序列预测模型选型：构建高效决策矩阵

TinyAGI：多智能体协作平台，打造你的24/7 AI数字团队

欧陆平台邀请码的正确填写步骤！娱乐使用

【11】ViT论文解析：图像为什么也能像句子交给Transformer

海投60份简历，0面试，我是不是真的很差？