当前位置: 首页 > news >正文

机器学习数据集+yolo数据集+深度学校数据集 yolo系列可用+卷及神经网络+目标检测+语义分割+姿态识别数据集 coco数据集 visdrone数据集

数据获取

数据获取 见文章底部卡片获取!!!!!!!!!!!!!!

数据集概览

数据集在计算机视觉任务中扮演着至关重要的角色,它们为模型提供了学习和理解世界的素材。Ultralytics 提供了广泛的数据集支持,旨在促进检测、实例分割、姿态估计、分类和多目标跟踪等任务的发展。本文将详细介绍 Ultralytics 支持的主要数据集,并探讨每个计算机视觉任务对应的特定数据集。

观看:Ultralytics 数据集概览

Ultralytics 曾经提供了一个名为 Explorer 的工具,用于探索和管理数据集。然而,截至 ultralytics>=8.3.10,Explorer 工具已被弃用。现在,用户可以通过Ultralytics Hub来进行无代码的数据管理和可视化工作。Ultralytics Hub 是一个直观的平台,它允许用户创建嵌入式搜索相似图像、运行 SQL 查询、执行语义搜索,甚至使用自然语言进行搜索。此外,用户还可以通过图形用户界面(GUI)应用程序或应用程序接口(API)来构建自己的应用。这些功能极大地简化了工作流程,让用户可以专注于数据分析和模型训练。

物体检测

物体检测是计算机视觉领域中最常见的任务之一,其目的是识别和定位图像中的物体。Ultralytics 支持多个物体检测数据集,涵盖了从城市环境到农业领域的广泛应用场景:

  • Argoverse:包含来自城市环境的三维跟踪和运动预测数据,具有丰富的注释。

  • COCO:Common Objects in Context (COCO) 是一个大型物体检测、分割和字幕数据集,包含 80 个物体类别。

  • LVIS:大规模物体检测、分割和字幕数据集,包含 1203 个物体类别。

  • COCO8 和 COCO128:COCO 数据集的小型子集,适合快速测试和实验。

  • 全球小麦 2020:包含 2020 年全球小麦挑战赛的小麦头图像。

  • Object365:用于物体检测的高质量大规模数据集,包含 365 个物体类别和 600K 多张注释图像。

  • OpenImagesV7:由 Google 提供的综合数据集,包含 170 万张训练图像和 4.2 万张验证图像。

  • SKU-110K:零售环境中密集物体检测的数据集,包含超过 11K 幅图像和 170 万个边界框。

  • VisDrone:无人机捕获图像中的物体检测和多物体跟踪数据集,有超过 10K 幅图像和视频序列。

  • VOC:Pascal Visual Object Classes (VOC) 数据集,包含 20 个物体类别和超过 11K 幅图像。

  • xView:高空图像中物体检测的数据集,包含 60 个物体类别和 100 多万个注释物体。

  • RF100:多样化的物体检测基准,包含 100 个数据集,横跨 7 个图像领域,用于综合模型评估。

  • 脑肿瘤:用于检测脑肿瘤的数据集,包括核磁共振成像或 CT 扫描图像。

  • 非洲野生动物:非洲野生动物图像数据集,包括水牛、大象、犀牛和斑马。

  • 签名:带有签名注释的各种文件图像数据集,支持文件验证和欺诈检测研究。

实例分割

实例分割不仅识别图像中的物体,还精确勾勒出每个物体的轮廓。Ultralytics 支持以下实例分割数据集:

  • COCO:专为物体检测、分割和字幕任务设计的大型数据集,包含 20 多万张标注图像。
  • COCO8-seg 和 COCO128-seg:COCO 数据集的较小子集,适用于快速测试实例分割任务。
  • Crack-seg:专门用于检测道路和墙壁裂缝的数据集。
  • Package-seg:为识别仓库或工业环境中的包裹而定制的数据集。
  • Carparts-seg:专门用于识别汽车零部件的数据集,满足设计、制造和研究的需要。
姿态估计

姿态估计技术用于确定物体相对于摄像机或世界坐标系的姿态。以下是 Ultralytics 支持的姿态估计数据集:

  • COCO:大规模人类姿势注释数据集。
  • COCO8-pose:用于姿态估计任务的较小数据集,包含 8 幅 COCO 图像的子集。
  • Tiger-pose:紧凑型老虎主题数据集,每只老虎有 12 个关键点。
  • 手部关键点:包含 26,000 多张以人手为中心的图像,每只手有 21 个关键点。
  • Dog-pose:包含约 6,000 张以狗为主题的图像,每只狗有 24 个关键点。
分类

图像分类任务涉及根据图像内容将其归入预定义的类别。以下是常用的分类数据集:

  • Caltech 101 和 Caltech 256:分别包含 101 和 256 个对象类别的图像数据集。
  • CIFAR-10 和 CIFAR-100:小型彩色图像数据集,分为 10 或 100 类。
  • 时尚-MNIST:由 10 个时尚类别的 70,000 张灰度图像组成的数据集。
  • ImageNet:大型数据集,包含超过 1,400 万张图像和 20,000 个类别。
  • ImageNet-10 和 Imagenette:ImageNet 的较小子集,用于更快地进行实验。
  • Imagewoof:更具挑战性的 ImageNet 子集,包含 10 个犬种类别。
  • MNIST:由 70,000 幅手写数字灰度图像组成的数据集。
  • MNIST160:MNIST 数据集中每个类别的前 8 幅图像,共包含 160 张图像。
定向边框(OBB)

定向包围盒(OBB)是一种利用旋转包围盒检测倾斜物体的方法,通常应用于航空和卫星图像。相关数据集包括:

  • DOTA-v2:流行的 OBB 航空图像数据集,包含 170 万个实例和 11,268 幅图像。
  • DOTA8:DOTAv1 分割集的较小子集,适合快速测试。
多目标跟踪

多目标跟踪涉及在视频序列中检测和跟踪多个目标。Ultralytics 支持以下多目标跟踪数据集:

  • Argoverse:城市环境中的三维跟踪和运动预测数据。
  • VisDrone:无人机捕获图像中的物体检测和多物体跟踪数据。
贡献新数据集

为了确保新数据集与现有基础设施的一致性,贡献者需要遵循一系列步骤:

  1. 收集图像:从公共数据库或个人收藏中收集图像。
  2. 注释图像:根据任务应用边界框、线段或关键点进行注释。
  3. 导出注释:将注释转换为 YOLO *.txt 格式。
  4. 整理数据集:按照 train/ 和 val/ 目录结构组织数据集,每个目录包含 images/ 和 labels/ 子目录。
  5. 创建 data.yaml 文件:描述数据集、类别和其他必要信息。
  6. 优化图像(可选):减小数据集大小以提高处理效率。
  7. 压缩数据集:将整个数据集文件夹压缩成 zip 文件。
  8. 文档和公关:创建文档页面并提交拉取请求 (PR)。

通过上述步骤,您可以确保提供的新数据集能够顺利整合到 Ultralytics 现有的结构中,从而为社区做出贡献。

优化和压缩数据集的示例代码
frompathlibimportPathfromultralytics.data.utilsimportcompress_one_imagefromultralytics.utils.downloadsimportzip_directory# Define dataset directorypath=Path("path/to/dataset")# Optimize images in dataset (optional)forfinpath.rglob("*.jpg"):compress_one_image(f)# Zip dataset into 'path/to/dataset.zip'zip_directory(path)
常见问题

Ultralytics 支持哪些数据集进行物体检测?

Ultralytics 支持多种物体检测数据集,例如:

  • COCO:大规模物体检测、分割和字幕数据集,包含 80 个物体类别。
  • LVIS:包含 1203 个物体类别的广泛数据集。
  • Argoverse:城市环境中的三维跟踪和运动预测数据。
  • VisDrone:无人机拍摄的物体检测和多物体跟踪数据。
  • SKU-110K:零售环境中密集物体检测的数据集。

这些数据集有助于为各种物体检测应用训练稳健的模型。

如何向 Ultralytics 提供新数据集?

提供新数据集涉及几个步骤,包括收集和注释图像、导出注释为 YOLO *.txt 格式、整理数据集结构、创建 data.yaml 文件、优化图像(可选)、压缩数据集以及提交文档和 PR。通过遵循这些指导方针,您能有效地为社区贡献新的资源。

综上所述,Ultralytics 提供了丰富多样的数据集,覆盖了广泛的计算机视觉任务。无论您是在进行物体检测、实例分割、姿态估计、分类还是多目标跟踪,都能找到合适的数据集来支持您的研究和开发工作。如果您有兴趣贡献新数据集或进一步了解 Ultralytics 的数据集,请参考官方指南和文档获取更多信息。

代码 数据获取

见文章底部获取联系方式!!!!!!!
http://www.jsqmd.com/news/1087771/

相关文章:

  • Monica vs Sider:浏览器 AI 插件哪家更好用?
  • 如何3分钟将Chrome变成专业Markdown阅读器?终极免费方案
  • I3C总线协议深度解析:CCC命令与寄存器配置实战指南
  • 国产RS485收发器新卷王:3毛钱搞定20KV ESD与军规温区,设计能省多少料?
  • 深入解析WPR机器人仿真:掌握ROS机器人开发的核心技术实践
  • 显示屏接口对比:DPI、DBI、DSI详解
  • 不是不会用,是没开对“开关”:ChatGPT隐藏功能深度解锁(含免费访问GPT-4.5测试通道方法)
  • B站视频下载神器:BilibiliDown 全面使用指南
  • 基于 MATLAB 的实时火灾检测系统设计与实现
  • Scikit-Learn特征选择三类方法原理、陷阱与工程落地
  • Linux休眠唤醒全流程解析
  • 无损音频格式之争:从ALAC、FLAC到APE,谁是你的音乐档案最佳归宿?
  • 实战解析:如何精准测量镍镉电池的剩余容量与健康度
  • 终极魔兽世界技能自动化指南:GSE高级宏编译器完全解析
  • 078、matplotlib 绘图实战:Figure/Axes 模型、样式定制、中文字体解决
  • Ridge、Lasso与Elastic Net正则化原理与实战
  • Akagi:麻雀AI助手终极指南 - 从零开始成为麻将高手
  • 基于HSV颜色空间和形态学特征的火灾与烟雾智能检测系统(全网首发)
  • 运维人员新技能,码士集团大模型服务器运维私教课实战价值评估
  • 龙之崛起:从单机怀旧到稳定家庭联机的实战指南
  • 小米首款NAS深度剖析:当家庭数据枢纽遇上AI原生存储时代
  • 百度网盘直链解析终极指南:5分钟实现高速下载
  • Python代码保护与逆向:PyArmor加密原理与三种解密方法实战
  • OpenClaw:面向生产环境的AI Agent状态机架构
  • 【软考涨薪黄金窗口期】:2024Q3起企业补贴政策收紧倒计时,错过再等18个月!
  • 基于HarmonyOS 7.0 跨端开发的日记模板与心情追踪页面实战
  • 多租户架构在集团型企业和 SaaS 平台中的应用价值
  • 单片机IWIP NETCONN实验
  • 瑞萨RA MCU LIN总线驱动开发实战:从FSP配置到代码调试全解析
  • MyBatis批量插入性能调优实战:从ExecutorType.BATCH到现代最佳实践