当前位置：首页 > news >正文

PETRV2-BEV模型训练全流程：从数据准备到模型部署的星图AI实战

news 2026/5/12 3:34:33

PETRV2-BEV模型训练全流程：从数据准备到模型部署的星图AI实战

1. 引言

在自动驾驶领域，基于视觉的BEV（鸟瞰图）感知技术正逐渐成为主流解决方案。PETRV2-BEV作为当前最先进的视觉BEV模型之一，通过创新的3D位置编码和Transformer架构，实现了从多视角图像到统一BEV空间的高效映射。本文将详细介绍如何在星图AI平台上完成PETRV2-BEV模型的完整训练流程，从数据准备到最终部署。

2. 环境准备与数据下载

2.1 激活Paddle3D环境

首先需要激活预装的Paddle3D开发环境：

conda activate paddle3d_env

该环境已包含PaddlePaddle 2.4+和Paddle3D框架，确保后续命令可以正常执行。

2.2 下载预训练权重

使用以下命令下载官方提供的预训练模型权重：

wget -O /root/workspace/model.pdparams https://paddle3d.bj.bcebos.com/models/petr/petrv2_vovnet_gridmask_p4_800x320/model.pdparams

这个权重文件基于VoVNet主干网络，在NuScenes全量数据集上预训练得到，可以作为我们微调的起点。

2.3 获取NuScenes Mini数据集

为快速验证流程，我们先使用轻量级的NuScenes Mini数据集：

wget -O /root/workspace/v1.0-mini.tgz https://www.nuscenes.org/data/v1.0-mini.tgz mkdir -p /root/workspace/nuscenes tar -xf /root/workspace/v1.0-mini.tgz -C /root/workspace/nuscenes

该数据集包含约7000帧图像，覆盖10类常见交通参与者。

3. 数据预处理与模型训练

3.1 生成数据集信息文件

Paddle3D需要特定的信息文件来组织训练数据：

cd /usr/local/Paddle3D rm /root/workspace/nuscenes/petr_nuscenes_annotation_* -f python3 tools/create_petr_nus_infos.py --dataset_root /root/workspace/nuscenes/ --save_dir /root/workspace/nuscenes/ --mode mini_val

这将生成petr_nuscenes_annotation_train.pkl和petr_nuscenes_annotation_val.pkl两个文件。

3.2 初始模型评估

在训练前，我们先评估预训练模型在mini验证集上的表现：

python tools/evaluate.py \ --config configs/petr/petrv2_vovnet_gridmask_p4_800x320_nuscene.yml \ --model /root/workspace/model.pdparams \ --dataset_root /root/workspace/nuscenes/

输出结果中，mAP为0.2669，NDS为0.2878，显示模型已有一定基础性能。

3.3 启动模型训练

使用以下命令开始训练：

python tools/train.py \ --config configs/petr/petrv2_vovnet_gridmask_p4_800x320_nuscene.yml \ --model /root/workspace/model.pdparams \ --dataset_root /root/workspace/nuscenes/ \ --epochs 100 \ --batch_size 2 \ --log_interval 10 \ --learning_rate 1e-4 \ --save_interval 5 \ --do_eval

训练过程中每5个epoch会保存一次检查点，并在验证集上评估性能。

3.4 可视化训练过程

使用VisualDL工具监控训练指标：

visualdl --logdir ./output/ --host 0.0.0.0

通过端口转发可在本地浏览器查看训练曲线：

ssh -p 31264 -L 0.0.0.0:8888:localhost:8040 root@gpu-09rxs0pcu2.ssh.gpu.csdn.net

4. 模型导出与部署

4.1 导出推理模型

训练完成后，导出最佳模型为推理格式：

rm -rf /root/workspace/nuscenes_release_model mkdir -p /root/workspace/nuscenes_release_model python tools/export.py \ --config configs/petr/petrv2_vovnet_gridmask_p4_800x320_nuscene.yml \ --model output/best_model/model.pdparams \ --save_dir /root/workspace/nuscenes_release_model

4.2 运行DEMO演示

使用导出的模型进行可视化推理：

python tools/demo.py /root/workspace/nuscenes/ /root/workspace/nuscenes_release_model nuscenes

这将生成带有预测框的可视化结果，直观展示模型性能。

5. 扩展训练：XTREME1数据集

5.1 准备XTREME1数据

对于更复杂的XTREME1数据集，使用专用脚本处理：

cd /usr/local/Paddle3D rm /root/workspace/xtreme1_nuscenes_data/petr_nuscenes_annotation_* -f python3 tools/create_petr_nus_infos_from_xtreme1.py /root/workspace/xtreme1_nuscenes_data/

5.2 微调训练

启动针对XTREME1的微调：

python tools/train.py \ --config configs/petr/petrv2_vovnet_gridmask_p4_800x320.yml \ --model /root/workspace/model.pdparams \ --dataset_root /root/workspace/xtreme1_nuscenes_data/ \ --epochs 100 \ --batch_size 2 \ --log_interval 10 \ --learning_rate 1e-4 \ --save_interval 5 \ --do_eval

5.3 导出并测试XTREME1模型

rm -rf /root/workspace/xtreme1_release_model mkdir /root/workspace/xtreme1_release_model python tools/export.py \ --config configs/petr/petrv2_vovnet_gridmask_p4_800x320.yml \ --model output/best_model/model.pdparams \ --save_dir /root/workspace/xtreme1_release_model python tools/demo.py /root/workspace/xtreme1_nuscenes_data/ /root/workspace/xtreme1_release_model xtreme1