当前位置：首页 > news >正文

CANN具身智能-PI0训练样例

news 2026/6/27 11:58:39

PI0 在昇腾 Atlas A2 上的训练样例

【免费下载链接】cann-recipes-embodied-intelligence本项目针对具身智能业务中的典型模型、加速算法，提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence

本目录提供 PI0 训练样例，基于 LeRobot 在 LIBERO 数据集上完成分布式训练，并提供配套的环境准备、训练启动和评测脚本。

当前样例遵循以下原则：

cann-recipes仓库中仅保存训练样例目录、配置、脚本、文档和补丁；
lerobot作为外部依赖仓单独 clone；
setup.sh固定lerobotcommit id，并依次应用通用 Ascend 训练补丁与 PI0 专属补丁；
数据集、预训练权重和缓存目录均通过工作区相对路径组织。

1. 适用场景

硬件：昇腾 Atlas A2
CANN：8.3.0 及以上
任务：LIBERO 离线训练
数据集：HuggingFaceVLA/libero

2. 外部依赖与固定版本

本样例不内嵌lerobot源码，默认使用如下 commit：

58f70b6bd370864139a3795ac3497a9eae8c42d5

3. 目录说明

manipulation/pi0/train/ ├── README.md ├── doc/ │ └── README.md └── src/ ├── configs/ │ ├── pi0_libero.yaml │ └── pi0_libero_smoke.yaml ├── patches/ │ ├── lerobot_ascend_train_common.patch │ └── lerobot_pi0_ascend.patch └── scripts/ ├── run_eval.sh ├── run_train.sh └── setup.sh

4. 环境准备

4.1 clone 代码

git clone https://gitcode.com/cann/cann-recipes-embodied-intelligence.git cd cann-recipes-embodied-intelligence

4.2 准备`lerobot`

执行：

chmod +x manipulation/pi0/train/src/scripts/setup.sh ./manipulation/pi0/train/src/scripts/setup.sh

该脚本会：

在cann-recipes同级目录下准备lerobot代码仓；
checkout 到固定 commit58f70b6bd370864139a3795ac3497a9eae8c42d5；
应用通用 Ascend 训练补丁与 PI0 补丁；
安装 LeRobot 通用依赖、LIBERO 训练依赖和 PI0 所需的transformers分支；
已包含tqdm>=4.66.0,<5.0.0，可覆盖通用训练补丁中新增的 tqdm 进度条依赖；
默认复用当前已激活环境中的torch/torch_npu；
如需在新环境中执行，可通过参数创建 conda 环境，并通过本地 wheel 注入平台相关的torch/torchvision/torch_npu。

常见用法：

# 查看脚本帮助 ./manipulation/pi0/train/src/scripts/setup.sh --help # 复用当前已经准备好的 Ascend 训练环境 ./manipulation/pi0/train/src/scripts/setup.sh # 创建新 conda 环境，并从本地 wheel 安装平台栈 ./manipulation/pi0/train/src/scripts/setup.sh \ --create-conda \ --env-name lerobot-pi0 \ --python-version 3.10 \ --torch-wheel /path/to/torch.whl \ --torchvision-wheel /path/to/torchvision.whl \ --torch-npu-wheel /path/to/torch_npu.whl

说明：

平台栈建议由已有训练环境复用，或由使用者自行提供本地 wheel；
如已提前确认平台栈可用，也可以追加--skip-torch-check跳过末尾导入校验。
whl 链接可参考 https://github.com/Ascend/pytorch

4.3 推荐工作区布局

当前配置默认使用工作区相对路径，推荐布局如下：

<workspace>/ ├── cann-recipes-embodied-intelligence/ ├── lerobot/ ├── dataset/ │ └── HuggingFaceVLA/ │ └── libero/ ├── models/ │ ├── google/ │ │ └── paligemma-3b-pt-224/ │ └── lerobot/ │ └── pi0_base/ └── ckpt/

其中：

dataset/HuggingFaceVLA/libero需要直接指向包含data/、meta/的数据集根目录；
models/lerobot/pi0_base需要是本地可直接加载的 PI0 预训练模型目录；
models/google/paligemma-3b-pt-224需要是本地可直接加载的 PaliGemma tokenizer / processor 目录。模型来自https://huggingface.co/google/paligemma-3b-pt-224

注意：dataset、models、ckpt这三个目录需要自行创建和填充，本仓库只负责训练脚本和配置。

4.4 无网环境下的模型准备

PI0 训练至少依赖以下本地模型目录：

../models/lerobot/pi0_base
../models/google/paligemma-3b-pt-224

默认脚本会优先使用：

../models/google/paligemma-3b-pt-224

对应的环境变量名为：

export LEROBOT_PI0_TOKENIZER_PATH=/path/to/paligemma-3b-pt-224

如果未设置该变量，且默认目录不存在，则 processor 会回退到google/paligemma-3b-pt-224在线仓库名称。

5. 训练配置

5.0 YAML 格式约束

run_train.sh会用简单的awk逻辑读取配置里的output_dir与job_name，因此这两个字段建议保持单行简单键值格式，例如：

output_dir: ../ckpt/pi0_libero job_name: pi0_libero

约束建议：

不要将output_dir/job_name写成多行值（如|或>块标量）；
不要把它们写到嵌套结构里；
不要使用 YAML 锚点引用（&anchor/*alias）来定义这两个字段；
可以保留单行行内注释，但建议避免复杂 YAML 展开写法。

说明：

当前脚本已支持过滤output_dir/job_name上的单行行内注释；
后续若需要进一步提升复杂 YAML 场景下的健壮性，可考虑改为使用 Python YAML 解析库替代当前awk方案。

5.1 smoke 配置

配置文件：src/configs/pi0_libero_smoke.yaml
作用：快速验证环境、依赖、数据集路径和多卡训练链路
关键参数：
- batch_size: 16（每卡），8 卡时全局 batch128
- steps: 20
- compile_model: false
- wandb.enable: false

启动：

./manipulation/pi0/train/src/scripts/run_train.sh pi0_libero_smoke --port 29510

5.2 长训配置

配置文件：src/configs/pi0_libero.yaml
关键参数：
- steps: 30000
- batch_size: 8（每卡；全局 batch =batch_size × 卡数）
- num_workers: 16
- policy.dtype: bfloat16
- policy.compile_model: false
- wandb.enable: true

启动：

./manipulation/pi0/train/src/scripts/run_train.sh pi0_libero --port 29510

说明：

样例默认面向 8 卡 Atlas A2；
如果使用更少卡数或更小显存的平台，请先下调batch_size和num_workers。
run_train.sh默认开启以下已验证优化：
- LEROBOT_PI0_USE_FAST_BETA_SAMPLE=1
- LEROBOT_PI0_USE_NPU_FUSION_ATTENTION=1
- LEROBOT_PI0_DISABLE_OUTER_SUFFIX_CHECKPOINT=1

6. 评测说明

run_eval.sh是对lerobot-eval的轻量封装，参数直接透传。

在线 LIBERO 评测推荐：

CPU 执行 MuJoCo 仿真与渲染；
NPU 执行 policy 推理；
设置MUJOCO_GL=osmesa。

示例：

export MUJOCO_GL=osmesa ./manipulation/pi0/train/src/scripts/run_eval.sh \ --policy.path=/path/to/checkpoint/pretrained_model \ --policy.device=npu \ --env.type=libero \ --env.task=libero_spatial \ --eval.n_episodes=100 \ --eval.batch_size=1 \ --output_dir=/path/to/eval_out

7. 已验证结果摘要

当前已归档的一组参考结果：

训练吞吐对比：

场景	平台	优化项	吞吐
优化对比基线	Atlas A2`8`卡	baseline	`66 samples/s`
优化对比	Atlas A2`8`卡	`NPU fusion attention`	`71.11 samples/s`
优化对比	Atlas A2`8`卡	`disable outer suffix checkpoint`	`77.64 samples/s`
优化对比	Atlas A2`8`卡	两者同时开启	`81.77 samples/s`

训练任务：PI0 onHuggingFaceVLA/libero
评测方式：LIBERO 四个 suite 粗评
评测配置：eval.batch_size=1，policy.n_action_steps=10
评测口径：4个 suite × 每个 suite10个 task × 每个 task1次，共40个 case
评测结果：
- libero_spatial:80.0%(8/10)
- libero_object:100.0%(10/10)
- libero_goal:100.0%(10/10)
- libero_10:90.0%(9/10)
- 聚合结果：37/40 = 92.5%

libero_spatial任务示例

libero_object任务示例

libero_goal任务示例

libero_10任务示例

更详细的历史路径、wandb 链接和评测说明见：

doc/README.md

8. W&B 记录占位

9. 常用命令

查看训练日志

# 以下路径以推荐工作区中的 `cann-recipes-embodied-intelligence/` 目录为起点 cd ../lerobot tail -f ../ckpt/logs/train_pi0_libero_*.log

resume 训练

./manipulation/pi0/train/src/scripts/run_train.sh pi0_libero --resume --port 29510

10. 常见问题索引

更详细的迁移说明、配置原因和问题处理建议见：doc/README.md

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

查看全文

http://www.jsqmd.com/news/783734/

HIXL LLM-DataDist接口

C++ ONNX Runtime 实战：为什么我的 session-＞Run 在跨函数调用时就崩溃了？

CANN/AMCT OFMR大模型量化

OpenClaw爬虫框架实战：从Awesome清单到自动化数据采集系统构建

国内主流氯化镁生产厂家综合实力排行及选型指南 - 奔跑123

ngx_close_accepted_connection

别再画丑图了！用Mermaid的gitGraph在Markdown里画专业Git分支图（附VSCode插件配置）

基于OpenClaw构建多AI智能体协作平台：从数字生命蒸馏到理想国决策

告别粘连字符！用Halcon的partition_dynamic算子精准分割OCR区域（附完整代码）

AI音乐生成技术解析：从符号与音频生成到混合模型实战

向量引擎、deepseek v4、GPT Image 2、api key：Agent 时代最值钱的不是模型，是会调度的人

外资阀门品牌2026市场介绍：米勒（Miller） - 米勒阀门

基于微环谐振器的光子AI推理加速器：原理、设计与挑战

CANN算子测试竞赛中山大学软工小队提交

CANN/pypto lt函数API文档

如何免费获取网盘高速下载：LinkSwift 九大平台直链解析终极指南

AI水下目标检测：从传统图像处理到深度学习部署实战

工业盐技术选型指南：优质厂家的核心筛选维度 - 奔跑123

别再只会用ref_table了！ABAP ALV里给自定义字段加F4搜索帮助的完整流程（附代码）

深入SplaTAM代码：手把手解析3D高斯溅射（3DGS）如何与SLAM框架在Python/CUDA层协同工作

CANN/AMCT HiFloat8量化算法

2026 全国节能建筑围护材料优质厂家 TOP5 榜单——聚焦聚氨酯复合板、聚氨酯封边岩棉夹芯板、聚氨酯夹芯板全国供应商 - 深度智识库

2026年原创视频素材平台评测：国内项目与海外素材库的选型记录 - Fzzf_23

Ubuntu SCP传文件总失败？从ifconfig查IP到防火墙设置，保姆级排错指南

CANN LJForceFused算子测试报告

CANN/hcomm 算法分析器工具指南

CANN/pto-isa标量算术操作

从C语言到机器码：用RV32I指令集手写一个简单的加法函数（附完整汇编代码）

2026年原创视频素材平台清单：个人、企业和专业团队适用 - Fzzf_23

DAO治理自动化引擎：tomorrowDAO-skill架构解析与安全实践