当前位置：首页 > news >正文

PETRV2-BEV训练保姆级教程：nuscenes数据集结构解析与路径配置

news 2026/5/12 17:47:26

PETRV2-BEV训练保姆级教程：nuscenes数据集结构解析与路径配置

1. 环境准备与快速开始

想要训练PETRV2-BEV模型，首先需要搭建合适的环境。这个模型是基于Paddle3D框架开发的，专门用于自动驾驶场景的3D目标检测。简单来说，它能让计算机"看懂"周围环境，识别出车辆、行人等各种物体。

1.1 进入Paddle3D环境

打开终端，激活我们预先准备好的conda环境：

conda activate paddle3d_env

这个环境已经包含了所有必要的依赖库，包括PaddlePaddle深度学习框架和Paddle3D扩展库。如果还没有这个环境，需要先安装Anaconda或Miniconda，然后创建并配置相应的环境。

1.2 下载预训练权重

为了加速训练过程，我们可以使用预训练好的模型权重作为起点：

wget -O /root/workspace/model.pdparams https://paddle3d.bj.bcebos.com/models/petr/petrv2_vovnet_gridmask_p4_800x320/model.pdparams

这个预训练权重是在大规模数据集上训练得到的，包含了模型已经学习到的特征提取能力，能帮助我们更快地在新数据上获得好效果。

2. nuscenes数据集详解与准备

nuscenes数据集是自动驾驶领域最常用的公开数据集之一，包含了丰富的传感器数据和精细的标注信息。

2.1 下载nuscenes mini数据集

由于完整数据集很大，我们先用mini版本来进行实验：

wget -O /root/workspace/v1.0-mini.tgz https://www.nuscenes.org/data/v1.0-mini.tgz mkdir -p /root/workspace/nuscenes tar -xzf /root/workspace/v1.0-mini.tgz -C /root/workspace/nuscenes

mini版本包含了完整数据集的子集，足够我们进行模型训练和验证的实验。

2.2 nuscenes数据集结构解析

解压后的nuscenes数据集包含以下重要目录和文件：

nuscenes/ ├── samples/ # 传感器样本数据（图像、点云等） ├── sweeps/ # 中间帧数据 ├── maps/ # 高精地图数据 ├── v1.0-mini/ # 元数据和标注信息 │ ├── sample.json # 样本数据描述 │ ├── sample_data.json # 传感器数据信息 │ ├── instance.json # 实例标注信息 │ ├── category.json # 物体类别定义 │ ├── attribute.json # 物体属性 │ ├── visibility.json # 可见性信息 │ └── sensor.json # 传感器标定参数

理解这个结构很重要，因为PETRV2-BEV模型需要读取这些信息来获取图像、点云数据以及对应的标注信息。

2.3 准备数据集标注信息

进入Paddle3D目录，生成模型需要的标注文件：

cd /usr/local/Paddle3D rm /root/workspace/nuscenes/petr_nuscenes_annotation_* -f python3 tools/create_petr_nus_infos.py --dataset_root /root/workspace/nuscenes/ --save_dir /root/workspace/nuscenes/ --mode mini_val

这个脚本会解析nuscenes的原始标注文件，生成PETRV2模型训练所需的特定格式的标注信息。它会创建训练集和验证集的划分，并提取必要的传感器标定参数。

3. 模型训练与评估

现在我们已经准备好了数据和环境，可以开始训练模型了。

3.1 测试初始精度

在开始训练之前，我们先测试一下预训练权重在nuscenes数据集上的初始表现：

python tools/evaluate.py \ --config configs/petr/petrv2_vovnet_gridmask_p4_800x320_nuscene.yml \ --model /root/workspace/model.pdparams \ --dataset_root /root/workspace/nuscenes/

你会看到类似这样的输出：

mAP: 0.2669 mATE: 0.7448 mASE: 0.4621 mAOE: 1.4553 mAVE: 0.2500 mAAE: 1.0000 NDS: 0.2878 Eval time: 5.8s Per-class results: Object Class AP ATE ASE AOE AVE AAE car 0.446 0.626 0.168 1.735 0.000 1.000 truck 0.381 0.500 0.199 1.113 0.000 1.000 bus 0.407 0.659 0.064 2.719 0.000 1.000

这些指标反映了模型在不同方面的性能：

mAP：平均精度，越高越好
mATE：平均平移误差，越低越好
NDS：nuScenes检测分数，综合指标

3.2 开始训练模型

现在开始正式训练，使用以下命令：

python tools/train.py \ --config configs/petr/petrv2_vovnet_gridmask_p4_800x320_nuscene.yml \ --model /root/workspace/model.pdparams \ --dataset_root /root/workspace/nuscenes/ \ --epochs 100 \ --batch_size 2 \ --log_interval 10 \ --learning_rate 1e-4 \ --save_interval 5 \ --do_eval

关键参数说明：

epochs 100：训练100个轮次
batch_size 2：每次训练使用2个样本（根据GPU内存调整）
learning_rate 1e-4：学习率设置为0.0001
save_interval 5：每5个epoch保存一次模型
do_eval：同时在验证集上评估性能

3.3 监控训练过程

训练过程中，我们可以实时查看损失曲线和指标变化：

visualdl --logdir ./output/ --host 0.0.0.0

如果是在远程服务器上训练，需要设置端口转发：

ssh -p 31264 -L 0.0.0.0:8888:localhost:8040 root@gpu-09rxs0pcu2.ssh.gpu.csdn.net

然后在浏览器中打开VisualDL界面，可以看到：

训练损失曲线（逐渐下降）
验证集指标变化（逐渐提升）
学习率调整情况

4. 模型导出与演示

训练完成后，我们需要将模型导出为推理格式，并进行效果演示。

4.1 导出推理模型

rm -rf /root/workspace/nuscenes_release_model mkdir -p /root/workspace/nuscenes_release_model python tools/export.py \ --config configs/petr/petrv2_vovnet_gridmask_p4_800x320_nuscene.yml \ --model output/best_model/model.pdparams \ --save_dir /root/workspace/nuscenes_release_model

导出的模型包含了网络结构和训练好的权重，可以直接用于推理，不需要重新训练。

4.2 运行演示程序

现在让我们看看模型的实际效果：

python tools/demo.py /root/workspace/nuscenes/ /root/workspace/nuscenes_release_model nuscenes

这个演示程序会：

加载训练好的模型
读取测试数据
进行3D目标检测推理
可视化检测结果

你会看到模型识别出的各种物体（车辆、行人等）以及它们的3D边界框，直观展示PETRV2-BEV的检测能力。

5. 进阶：在xtreme1数据集上训练

如果你想尝试更大的数据集，可以按照以下步骤在xtreme1数据集上进行训练。

5.1 准备xtreme1数据集

cd /usr/local/Paddle3D rm /root/workspace/xtreme1_nuscenes_data/petr_nuscenes_annotation_* -f python3 tools/create_petr_nus_infos_from_xtreme1.py /root/workspace/xtreme1_nuscenes_data/

xtreme1数据集规模更大，包含了更多样化的驾驶场景，能让模型学习到更丰富的特征。

5.2 训练与评估

训练命令与nuscenes类似，只需要调整数据集路径：

python tools/train.py \ --config configs/petr/petrv2_vovnet_gridmask_p4_800x320.yml \ --model /root/workspace/model.pdparams \ --dataset_root /root/workspace/xtreme1_nuscenes_data/ \ --epochs 100 \ --batch_size 2 \ --log_interval 10 \ --learning_rate 1e-4 \ --save_interval 5 \ --do_eval