当前位置：首页 > news >正文

新手必看：在星图AI平台训练PETRV2-BEV模型的完整教程

news 2026/7/12 8:33:41

新手必看：在星图AI平台训练PETRV2-BEV模型的完整教程

1. 前言：为什么选择PETRV2-BEV模型？

BEV（Bird's Eye View）感知是自动驾驶领域的关键技术，它能够将多视角摄像头采集的2D图像转换为鸟瞰视角的3D空间表示。PETRV2作为当前最先进的BEV感知模型之一，具有以下优势：

多视角融合能力强：有效整合前、后、左、右等不同视角的摄像头数据
3D检测精度高：在nuScenes等权威数据集上达到SOTA性能
训练效率优化：相比初代PETR，训练速度提升30%以上

本教程将手把手教你如何在星图AI平台上完成PETRV2-BEV模型的完整训练流程，即使你是深度学习新手也能轻松上手。

2. 环境准备与快速启动

2.1 激活预配置环境

星图AI平台已经为我们准备好了所有必要的软件环境，只需一条命令即可激活：

conda activate paddle3d_env

激活后，命令行提示符前会出现(paddle3d_env)标识。我们可以验证PaddlePaddle是否安装正确：

python -c "import paddle; print(paddle.__version__)"

如果输出类似2.6.0的版本号，说明环境配置正确。

2.2 了解目录结构

在开始前，我们先熟悉下关键目录：

/usr/local/Paddle3D：Paddle3D框架主目录
/root/workspace：我们的工作目录，用于存放数据和模型
/root/workspace/nuscenes：nuScenes数据集存放位置

3. 数据准备与预处理

3.1 下载预训练模型

PETRV2模型训练采用迁移学习方式，我们先下载官方预训练权重：

wget -O /root/workspace/model.pdparams https://paddle3d.bj.bcebos.com/models/petr/petrv2_vovnet_gridmask_p4_800x320/model.pdparams

下载完成后检查文件大小应为约172MB：

ls -lh /root/workspace/model.pdparams

3.2 获取nuScenes mini数据集

为快速验证流程，我们使用nuScenes v1.0-mini数据集：

wget -O /root/workspace/v1.0-mini.tgz https://www.nuscenes.org/data/v1.0-mini.tgz mkdir -p /root/workspace/nuscenes tar -xf /root/workspace/v1.0-mini.tgz -C /root/workspace/nuscenes

解压后目录结构应包含samples、sweeps等文件夹。

3.3 生成数据索引文件

PETRV2需要特定的数据索引格式，运行预处理脚本：

cd /usr/local/Paddle3D rm /root/workspace/nuscenes/petr_nuscenes_annotation_* -f python3 tools/create_petr_nus_infos.py --dataset_root /root/workspace/nuscenes/ --save_dir /root/workspace/nuscenes/ --mode mini_val

成功执行后会生成两个.pkl文件：

ls /root/workspace/nuscenes/petr_nuscenes_annotation_*.pkl

4. 模型训练与监控

4.1 启动训练任务

使用以下命令开始训练：

python tools/train.py \ --config configs/petr/petrv2_vovnet_gridmask_p4_800x320_nuscene.yml \ --model /root/workspace/model.pdparams \ --dataset_root /root/workspace/nuscenes/ \ --epochs 100 \ --batch_size 2 \ --log_interval 10 \ --learning_rate 1e-4 \ --save_interval 5 \ --do_eval

关键参数说明：

--epochs 100：训练100轮
--batch_size 2：每批处理2组数据（6视角×2=12张图）
--do_eval：每轮训练后进行验证集评估

4.2 监控训练过程

启动VisualDL可视化工具：

visualdl --logdir ./output/ --host 0.0.0.0

然后通过SSH端口转发查看训练曲线：

ssh -p 31264 -L 0.0.0.0:8888:localhost:8040 root@gpu-09rxs0pcu2.ssh.gpu.csdn.net

在浏览器访问http://localhost:8888，可以查看：

训练损失曲线
验证集mAP变化
学习率调整情况

5. 模型导出与效果验证

5.1 导出推理模型

训练完成后，导出最佳模型：

rm -rf /root/workspace/nuscenes_release_model mkdir -p /root/workspace/nuscenes_release_model python tools/export.py \ --config configs/petr/petrv2_vovnet_gridmask_p4_800x320_nuscene.yml \ --model output/best_model/model.pdparams \ --save_dir /root/workspace/nuscenes_release_model

导出的模型包含三个文件：

inference.pdmodel
inference.pdiparams
inference.pdiparams.info

5.2 运行DEMO测试

使用导出的模型进行可视化测试：

python tools/demo.py /root/workspace/nuscenes/ /root/workspace/nuscenes_release_model nuscenes

生成的检测结果保存在output/demo/目录下，包含：

原始多视角图像拼接
BEV视角下的3D检测框
各类别检测置信度

6. 进阶：Xtreme1数据集训练

6.1 数据准备

对于Xtreme1数据集，使用专用预处理脚本：

cd /usr/local/Paddle3D rm /root/workspace/xtreme1_nuscenes_data/petr_nuscenes_annotation_* -f python3 tools/create_petr_nus_infos_from_xtreme1.py /root/workspace/xtreme1_nuscenes_data/

6.2 训练与评估

启动Xtreme1专用训练：

python tools/train.py \ --config configs/petr/petrv2_vovnet_gridmask_p4_800x320.yml \ --model /root/workspace/model.pdparams \ --dataset_root /root/workspace/xtreme1_nuscenes_data/ \ --epochs 100 \ --batch_size 2 \ --log_interval 10 \ --learning_rate 1e-4 \ --save_interval 5 \ --do_eval