当前位置：首页 > news >正文

机器学习数据集+yolo数据集+深度学校数据集 yolo系列可用+卷及神经网络+目标检测+语义分割+姿态识别数据集 coco数据集 visdrone数据集

news 2026/6/29 5:44:31

数据获取

数据获取 见文章底部卡片获取！！！！！！！！！！！！！！

数据集概览

数据集在计算机视觉任务中扮演着至关重要的角色，它们为模型提供了学习和理解世界的素材。Ultralytics 提供了广泛的数据集支持，旨在促进检测、实例分割、姿态估计、分类和多目标跟踪等任务的发展。本文将详细介绍 Ultralytics 支持的主要数据集，并探讨每个计算机视觉任务对应的特定数据集。

观看：Ultralytics 数据集概览

Ultralytics 曾经提供了一个名为 Explorer 的工具，用于探索和管理数据集。然而，截至 ultralytics>=8.3.10，Explorer 工具已被弃用。现在，用户可以通过Ultralytics Hub来进行无代码的数据管理和可视化工作。Ultralytics Hub 是一个直观的平台，它允许用户创建嵌入式搜索相似图像、运行 SQL 查询、执行语义搜索，甚至使用自然语言进行搜索。此外，用户还可以通过图形用户界面（GUI）应用程序或应用程序接口（API）来构建自己的应用。这些功能极大地简化了工作流程，让用户可以专注于数据分析和模型训练。

物体检测

物体检测是计算机视觉领域中最常见的任务之一，其目的是识别和定位图像中的物体。Ultralytics 支持多个物体检测数据集，涵盖了从城市环境到农业领域的广泛应用场景：

Argoverse：包含来自城市环境的三维跟踪和运动预测数据，具有丰富的注释。
COCO：Common Objects in Context (COCO) 是一个大型物体检测、分割和字幕数据集，包含 80 个物体类别。
LVIS：大规模物体检测、分割和字幕数据集，包含 1203 个物体类别。
COCO8 和 COCO128：COCO 数据集的小型子集，适合快速测试和实验。
全球小麦 2020：包含 2020 年全球小麦挑战赛的小麦头图像。
Object365：用于物体检测的高质量大规模数据集，包含 365 个物体类别和 600K 多张注释图像。
OpenImagesV7：由 Google 提供的综合数据集，包含 170 万张训练图像和 4.2 万张验证图像。
SKU-110K：零售环境中密集物体检测的数据集，包含超过 11K 幅图像和 170 万个边界框。
VisDrone：无人机捕获图像中的物体检测和多物体跟踪数据集，有超过 10K 幅图像和视频序列。
VOC：Pascal Visual Object Classes (VOC) 数据集，包含 20 个物体类别和超过 11K 幅图像。
xView：高空图像中物体检测的数据集，包含 60 个物体类别和 100 多万个注释物体。
RF100：多样化的物体检测基准，包含 100 个数据集，横跨 7 个图像领域，用于综合模型评估。
脑肿瘤：用于检测脑肿瘤的数据集，包括核磁共振成像或 CT 扫描图像。
非洲野生动物：非洲野生动物图像数据集，包括水牛、大象、犀牛和斑马。
签名：带有签名注释的各种文件图像数据集，支持文件验证和欺诈检测研究。

实例分割

实例分割不仅识别图像中的物体，还精确勾勒出每个物体的轮廓。Ultralytics 支持以下实例分割数据集：

COCO：专为物体检测、分割和字幕任务设计的大型数据集，包含 20 多万张标注图像。
COCO8-seg 和 COCO128-seg：COCO 数据集的较小子集，适用于快速测试实例分割任务。
Crack-seg：专门用于检测道路和墙壁裂缝的数据集。
Package-seg：为识别仓库或工业环境中的包裹而定制的数据集。
Carparts-seg：专门用于识别汽车零部件的数据集，满足设计、制造和研究的需要。

姿态估计

姿态估计技术用于确定物体相对于摄像机或世界坐标系的姿态。以下是 Ultralytics 支持的姿态估计数据集：

COCO：大规模人类姿势注释数据集。
COCO8-pose：用于姿态估计任务的较小数据集，包含 8 幅 COCO 图像的子集。
Tiger-pose：紧凑型老虎主题数据集，每只老虎有 12 个关键点。
手部关键点：包含 26,000 多张以人手为中心的图像，每只手有 21 个关键点。
Dog-pose：包含约 6,000 张以狗为主题的图像，每只狗有 24 个关键点。

定向边框（OBB）

定向包围盒（OBB）是一种利用旋转包围盒检测倾斜物体的方法，通常应用于航空和卫星图像。相关数据集包括：

DOTA-v2：流行的 OBB 航空图像数据集，包含 170 万个实例和 11,268 幅图像。
DOTA8：DOTAv1 分割集的较小子集，适合快速测试。

多目标跟踪

多目标跟踪涉及在视频序列中检测和跟踪多个目标。Ultralytics 支持以下多目标跟踪数据集：

Argoverse：城市环境中的三维跟踪和运动预测数据。
VisDrone：无人机捕获图像中的物体检测和多物体跟踪数据。

贡献新数据集

为了确保新数据集与现有基础设施的一致性，贡献者需要遵循一系列步骤：

收集图像：从公共数据库或个人收藏中收集图像。
注释图像：根据任务应用边界框、线段或关键点进行注释。
导出注释：将注释转换为 YOLO *.txt 格式。
整理数据集：按照 train/ 和 val/ 目录结构组织数据集，每个目录包含 images/ 和 labels/ 子目录。
创建 data.yaml 文件：描述数据集、类别和其他必要信息。
优化图像（可选）：减小数据集大小以提高处理效率。
压缩数据集：将整个数据集文件夹压缩成 zip 文件。
文档和公关：创建文档页面并提交拉取请求 (PR)。

通过上述步骤，您可以确保提供的新数据集能够顺利整合到 Ultralytics 现有的结构中，从而为社区做出贡献。

优化和压缩数据集的示例代码

frompathlibimportPathfromultralytics.data.utilsimportcompress_one_imagefromultralytics.utils.downloadsimportzip_directory# Define dataset directorypath=Path("path/to/dataset")# Optimize images in dataset (optional)forfinpath.rglob("*.jpg"):compress_one_image(f)# Zip dataset into 'path/to/dataset.zip'zip_directory(path)

常见问题

Ultralytics 支持哪些数据集进行物体检测？

Ultralytics 支持多种物体检测数据集，例如：

COCO：大规模物体检测、分割和字幕数据集，包含 80 个物体类别。
LVIS：包含 1203 个物体类别的广泛数据集。
Argoverse：城市环境中的三维跟踪和运动预测数据。
VisDrone：无人机拍摄的物体检测和多物体跟踪数据。
SKU-110K：零售环境中密集物体检测的数据集。

这些数据集有助于为各种物体检测应用训练稳健的模型。

如何向 Ultralytics 提供新数据集？

提供新数据集涉及几个步骤，包括收集和注释图像、导出注释为 YOLO *.txt 格式、整理数据集结构、创建 data.yaml 文件、优化图像（可选）、压缩数据集以及提交文档和 PR。通过遵循这些指导方针，您能有效地为社区贡献新的资源。

综上所述，Ultralytics 提供了丰富多样的数据集，覆盖了广泛的计算机视觉任务。无论您是在进行物体检测、实例分割、姿态估计、分类还是多目标跟踪，都能找到合适的数据集来支持您的研究和开发工作。如果您有兴趣贡献新数据集或进一步了解 Ultralytics 的数据集，请参考官方指南和文档获取更多信息。

代码数据获取

见文章底部获取联系方式！！！！！！！

查看全文

http://www.jsqmd.com/news/1087771/

Monica vs Sider：浏览器 AI 插件哪家更好用？

如何3分钟将Chrome变成专业Markdown阅读器？终极免费方案

I3C总线协议深度解析：CCC命令与寄存器配置实战指南

国产RS485收发器新卷王：3毛钱搞定20KV ESD与军规温区，设计能省多少料？

深入解析WPR机器人仿真：掌握ROS机器人开发的核心技术实践

显示屏接口对比：DPI、DBI、DSI详解

不是不会用，是没开对“开关”：ChatGPT隐藏功能深度解锁（含免费访问GPT-4.5测试通道方法）

B站视频下载神器：BilibiliDown 全面使用指南

基于 MATLAB 的实时火灾检测系统设计与实现

Scikit-Learn特征选择三类方法原理、陷阱与工程落地

Linux休眠唤醒全流程解析

无损音频格式之争：从ALAC、FLAC到APE，谁是你的音乐档案最佳归宿？

实战解析：如何精准测量镍镉电池的剩余容量与健康度

终极魔兽世界技能自动化指南：GSE高级宏编译器完全解析

078、matplotlib 绘图实战：Figure/Axes 模型、样式定制、中文字体解决

Ridge、Lasso与Elastic Net正则化原理与实战

Akagi：麻雀AI助手终极指南 - 从零开始成为麻将高手

基于HSV颜色空间和形态学特征的火灾与烟雾智能检测系统（全网首发）

运维人员新技能，码士集团大模型服务器运维私教课实战价值评估

龙之崛起：从单机怀旧到稳定家庭联机的实战指南

小米首款NAS深度剖析：当家庭数据枢纽遇上AI原生存储时代

百度网盘直链解析终极指南：5分钟实现高速下载

Python代码保护与逆向：PyArmor加密原理与三种解密方法实战

OpenClaw：面向生产环境的AI Agent状态机架构

【软考涨薪黄金窗口期】：2024Q3起企业补贴政策收紧倒计时，错过再等18个月！

基于HarmonyOS 7.0 跨端开发的日记模板与心情追踪页面实战

多租户架构在集团型企业和 SaaS 平台中的应用价值

单片机IWIP NETCONN实验

瑞萨RA MCU LIN总线驱动开发实战：从FSP配置到代码调试全解析

MyBatis批量插入性能调优实战：从ExecutorType.BATCH到现代最佳实践