当前位置：首页 > news >正文

自动驾驶感知利器：PETRV2-BEV模型快速部署指南

news 2026/7/1 8:28:35

自动驾驶感知利器：PETRV2-BEV模型快速部署指南

1. 环境准备与快速开始

想要快速上手PETRV2-BEV模型训练吗？这个指南将带你从零开始，在星图AI算力平台上完成整个部署和训练流程。无需担心复杂的配置，跟着步骤一步步来，你就能在自己的环境中运行这个先进的自动驾驶感知模型。

首先确保你已经进入了正确的运行环境：

conda activate paddle3d_env

这个环境已经预装了所有必要的依赖，包括PaddlePaddle深度学习框架和Paddle3D开发库，让你可以直接开始模型训练。

2. 下载必要资源

2.1 获取预训练模型权重

为了节省训练时间，我们先下载官方提供的预训练模型：

wget -O /root/workspace/model.pdparams https://paddle3d.bj.bcebos.com/models/petr/petrv2_vovnet_gridmask_p4_800x320/model.pdparams

这个模型基于VoVNet主干网络，已经在完整数据集上进行了预训练，可以作为我们微调的起点。

2.2 准备训练数据

我们使用NuScenes数据集的mini版本进行快速验证：

wget -O /root/workspace/v1.0-mini.tgz https://www.nuscenes.org/data/v1.0-mini.tgz mkdir -p /root/workspace/nuscenes tar -xf /root/workspace/v1.0-mini.tgz -C /root/workspace/nuscenes

这个mini数据集包含约7000帧图像，覆盖10种不同的交通参与者类别，足够我们进行初步的模型验证和训练。

3. 模型训练完整流程

3.1 数据预处理

在开始训练前，需要将原始数据转换为模型可读的格式：

cd /usr/local/Paddle3D rm /root/workspace/nuscenes/petr_nuscenes_annotation_* -f python3 tools/create_petr_nus_infos.py --dataset_root /root/workspace/nuscenes/ --save_dir /root/workspace/nuscenes/ --mode mini_val

这个步骤会生成训练和验证所需的信息文件，让模型知道如何读取和处理数据。

3.2 初始模型评估

我们先测试一下预训练模型在mini数据集上的表现：

python tools/evaluate.py \ --config configs/petr/petrv2_vovnet_gridmask_p4_800x320_nuscene.yml \ --model /root/workspace/model.pdparams \ --dataset_root /root/workspace/nuscenes/

你会看到类似这样的输出结果：

mAP: 0.2669 mATE: 0.7448 mASE: 0.4621 mAOE: 1.4553 mAVE: 0.2500 mAAE: 1.0000 NDS: 0.2878 Eval time: 5.8s Per-class results: Object Class AP ATE ASE AOE AVE AAE car 0.446 0.626 0.168 1.735 0.000 1.000 truck 0.381 0.500 0.199 1.113 0.000 1.000 bus 0.407 0.659 0.064 2.719 0.000 1.000

从结果可以看出，模型在车辆检测上表现不错，但在一些少见类别上还有提升空间。

3.3 开始模型训练

现在启动训练过程，我们设置100个训练周期：

python tools/train.py \ --config configs/petr/petrv2_vovnet_gridmask_p4_800x320_nuscene.yml \ --model /root/workspace/model.pdparams \ --dataset_root /root/workspace/nuscenes/ \ --epochs 100 \ --batch_size 2 \ --log_interval 10 \ --learning_rate 1e-4 \ --save_interval 5 \ --do_eval

这里使用了较小的batch size（2），适合在单卡GPU上运行。训练过程中每10步会输出一次日志，每5个周期会自动保存一次模型并在验证集上评估。

3.4 监控训练过程

想要实时查看训练进度和效果变化吗？使用VisualDL工具可以可视化训练曲线：

visualdl --logdir ./output/ --host 0.0.0.0

然后通过端口转发在本地浏览器中查看：

ssh -p 31264 -L 0.0.0.0:8888:localhost:8040 root@gpu-09rxs0pcu2.ssh.gpu.csdn.net

打开浏览器访问http://localhost:8888，你就能看到损失函数下降曲线和精度提升情况，帮助判断训练是否正常进行。

3.5 导出推理模型

训练完成后，将最佳模型导出为部署格式：

rm -rf /root/workspace/nuscenes_release_model mkdir -p /root/workspace/nuscenes_release_model python tools/export.py \ --config configs/petr/petrv2_vovnet_gridmask_p4_800x320_nuscene.yml \ --model output/best_model/model.pdparams \ --save_dir /root/workspace/nuscenes_release_model

导出的模型包含三个文件：model.pdmodel（模型结构）、model.pdiparams（模型参数）和deploy.yaml（部署配置），可以直接用于推理部署。

3.6 运行演示程序

最后，让我们看看模型的实际效果：

python tools/demo.py /root/workspace/nuscenes/ /root/workspace/nuscenes_release_model nuscenes

这个演示程序会加载训练好的模型，对测试图像进行推理，并生成带有检测框的可视化结果，让你直观地看到模型在复杂道路场景中的感知能力。

4. 进阶训练：XTREME1数据集适配

4.1 准备XTREME1数据

如果你有XTREME1数据集，可以尝试在更具挑战性的场景下训练模型：

cd /usr/local/Paddle3D rm /root/workspace/xtreme1_nuscenes_data/petr_nuscenes_annotation_* -f python3 tools/create_petr_nus_infos_from_xtreme1.py /root/workspace/xtreme1_nuscenes_data/

XTREME1数据集包含更多极端天气和光照条件，能测试模型在恶劣环境下的鲁棒性。

4.2 训练与导出

使用类似的命令进行训练和导出，只需替换数据集路径：

python tools/train.py \ --config configs/petr/petrv2_vovnet_gridmask_p4_800x320.yml \ --model /root/workspace/model.pdparams \ --dataset_root /root/workspace/xtreme1_nuscenes_data/ \ --epochs 100 \ --batch_size 2 \ --log_interval 10 \ --learning_rate 1e-4 \ --save_interval 5 \ --do_eval