Objectron完全指南:如何使用谷歌开源3D物体检测数据集快速入门
Objectron完全指南:如何使用谷歌开源3D物体检测数据集快速入门
【免费下载链接】ObjectronObjectron is a dataset of short, object-centric video clips. In addition, the videos also contain AR session metadata including camera poses, sparse point-clouds and planes. In each video, the camera moves around and above the object and captures it from different views. Each object is annotated with a 3D bounding box. The 3D bounding box describes the object’s position, orientation, and dimensions. The dataset contains about 15K annotated video clips and 4M annotated images in the following categories: bikes, books, bottles, cameras, cereal boxes, chairs, cups, laptops, and shoes项目地址: https://gitcode.com/gh_mirrors/ob/Objectron
Objectron是谷歌开源的3D物体检测数据集,包含15K标注视频片段和4M标注图像,涵盖自行车、书籍、瓶子等9个日常物品类别。本文将带您从零开始了解这个强大的数据集,掌握其核心功能与快速上手方法。
📌 什么是Objectron?
Objectron是一个以物体为中心的视频数据集,每个视频都包含AR会话元数据,如相机姿态、稀疏点云和平面信息。通过多角度拍摄同一物体并标注3D边界框,它为计算机视觉模型提供了丰富的训练素材。
图:Objectron数据集中不同类别的3D边界框标注示例,展示了自行车、书籍、瓶子等物体的空间位置与姿态
核心优势
- 多模态数据:不仅包含图像,还提供相机参数、点云等3D信息
- 丰富标注:精确的3D边界框描述物体位置、方向和尺寸
- 跨平台支持:提供TensorFlow/PyTorch等多种框架的使用示例
- 多样化场景:数据来自五大洲10个国家,确保地理多样性
📊 数据集概览
类别分布
Objectron涵盖9个常见物体类别,具体视频和帧数量如下:
| 类别 | 视频数 | 帧数 |
|---|---|---|
| 自行车 | 476 | 150k |
| 书籍 | 2024 | 576k |
| 瓶子 | 1928 | 476k |
| 相机 | 815 | 233k |
| 麦片盒 | 1609 | 396k |
| 椅子 | 1943 | 488k |
| 杯子 | 2204 | 546k |
| 笔记本电脑 | 1473 | 485k |
| 鞋子 | 2116 | 557k |
数据格式
数据集存储在Google Cloud Storage中,主要包含:
- 视频序列(.MOV格式)
- 3D边界框标注(geometry.pbdata文件)
- AR元数据(相机姿态、点云等)
- 预处理的tf.record文件(方便模型训练)
原始数据集大小约1.9TB,包含视频和标注;完整数据集(含处理后文件)约4.4TB。
🚀 快速开始
1️⃣ 环境准备
首先克隆仓库:
git clone https://gitcode.com/gh_mirrors/ob/Objectron cd Objectron2️⃣ 数据集下载
使用提供的Jupyter笔记本快速下载数据:
- Download Data.ipynb:包含数据集下载和访问方法
3️⃣ 入门示例
根据您使用的框架选择相应教程:
- Hello World.ipynb:TensorFlow加载示例
- Objectron_Pytorch_tutorial.ipynb:PyTorch使用指南
🛠️ 核心功能使用
解析标注文件
Objectron使用protobuf格式存储标注,可通过以下工具解析:
- Parse Annotations.ipynb:标注文件解析教程
- 标注定义:object.proto
处理AR元数据
元数据包含丰富的3D环境信息,解析方法:
- objectron-geometry-tutorial.ipynb:AR元数据解析示例
- 元数据定义:a_r_capture_metadata.proto
3D模型评估
使用3D IoU指标评估模型性能:
- 3D_IOU.ipynb:3D交并比计算教程
- 评估工具:objectron/dataset/iou.py
💡 高级应用
序列数据处理
Objectron提供视频序列数据,适用于时序模型训练:
- SequenceExamples.ipynb:序列数据处理教程
NeRF模型训练
利用Objectron的多角度数据训练NeRF模型:
- Objectron_NeRF_Tutorial.ipynb:NeRF训练指南
📄 许可证信息
Objectron采用Computational Use of Data Agreement 1.0 (C-UDA-1.0)许可证,允许学术和商业用途,但需遵循相应条款。
📚 引用与资源
如果您在研究中使用Objectron,请引用以下论文:
@article{objectron2021, title={Objectron: A Large Scale Dataset of Object-Centric Videos in the Wild with Pose Annotations}, author={Adel Ahmadyan, Liangkai Zhang, Artsiom Ablavatski, Jianing Wei, Matthias Grundmann}, journal={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition}, year={2021} }更多资源:
- 核心代码:objectron/dataset/
- 数据索引:index/
- 教程集合:notebooks/
通过本指南,您已经了解Objectron的基本概念和使用方法。无论是3D物体检测、姿态估计还是场景理解,这个数据集都能为您的项目提供强大支持。立即开始探索,开启您的3D计算机视觉之旅吧!
【免费下载链接】ObjectronObjectron is a dataset of short, object-centric video clips. In addition, the videos also contain AR session metadata including camera poses, sparse point-clouds and planes. In each video, the camera moves around and above the object and captures it from different views. Each object is annotated with a 3D bounding box. The 3D bounding box describes the object’s position, orientation, and dimensions. The dataset contains about 15K annotated video clips and 4M annotated images in the following categories: bikes, books, bottles, cameras, cereal boxes, chairs, cups, laptops, and shoes项目地址: https://gitcode.com/gh_mirrors/ob/Objectron
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
