当前位置：首页 > news >正文

Physical AI Smart Spaces 2024 vs 2025：两代数据集关键差异对比

news 2026/7/28 9:15:16

Physical AI Smart Spaces 2024 vs 2025：两代数据集关键差异对比

【免费下载链接】PhysicalAI-SmartSpaces项目地址: https://ai.gitcode.com/hf_mirrors/nvidia/PhysicalAI-SmartSpaces

在计算机视觉和多摄像机跟踪领域，Physical AI Smart Spaces数据集已成为业界标杆。这个由NVIDIA开发的合成数据集为研究人员和开发者提供了丰富的多摄像机跟踪和3D目标检测训练资源。今天，我们将深入对比2024和2025两个版本的关键差异，帮助您选择最适合自己需求的数据集版本。🚀

📊 数据集概述

Physical AI Smart Spaces是一个综合性标注数据集，专为多摄像机跟踪和2D/3D目标检测任务设计。该数据集使用Omniverse平台合成生成，包含仓库、医院、零售等多种室内场景的同步视频数据。

🎯 2024版本：基础版多摄像机跟踪数据集

MTMC_Tracking_2024作为初代版本，为多摄像机跟踪任务奠定了坚实基础：

核心特点

场景数量：90个不同室内场景
视频时长：超过250小时的同步视频
摄像机数量：953个摄像机视角
数据格式：传统MOTChallenge文本格式
标注类型：2D边界框和多摄像机跟踪ID
物体类别：仅包含人类（2,481个个体）
数据总量：216.95 GB

标注格式示例

<camera_id> <obj_id> <frame_id> <xmin> <ymin> <width> <height> <xworld> <yworld>

🚀 2025版本：全面升级的3D感知数据集

MTMC_Tracking_2025在2024版本基础上进行了全面升级，引入了更多高级功能：

革命性改进

场景数量：23个精心设计的场景
视频时长：42小时高质量视频
摄像机数量：504个优化布置的摄像机
数据格式：现代化JSON格式
标注类型：2D+3D边界框、多摄像机跟踪ID
物体类别：7种不同类型（人类、叉车、机器人等）
新增数据：深度图支持
数据总量：3.31 TB（包含深度图）

目录结构优化

MTMC_Tracking_2025/ ├── videos/ # 视频文件 ├── depth_maps/ # 深度图（PNG+HDF5） ├── ground_truth.json # 详细标注 ├── calibration.json # 相机标定 └── map.png # 场景俯视图

🔍 关键差异对比表

特性维度	2024版本	2025版本	升级意义
数据格式	TXT文本格式	JSON结构化格式	更易解析和处理
标注维度	2D边界框	2D+3D边界框	支持3D感知任务
物体类别	仅人类	7种物体类型	更丰富的应用场景
数据量	216.95 GB	3.31 TB	包含深度图数据
场景数量	90个	23个	质量优于数量
摄像机数	953个	504个	更优化的布置
3D框数量	无	890万	支持3D检测
2D框数量	1.35亿	7300万	更精准的标注
深度图	不支持	支持	增强感知能力

📈 格式升级详解

2024格式局限性

# 传统MOTChallenge格式 1 100 30 150 200 50 80 12.5 8.3

2025格式优势

{ "30": [ { "object_type": "Person", "object_id": 100, "3d_location": [12.5, 8.3, 1.2], "3d_bounding_box_scale": [0.5, 0.3, 1.8], "3d_bounding_box_rotation": [0, 0, 45], "2d_bounding_box_visible": { "1": [150, 200, 200, 280] } } ] }