当前位置: 首页 > news >正文

CANN pi0机器人VLA大模型昇腾推理指南

pi0机器人VLA大模型昇腾使用指南

【免费下载链接】cann-recipes-embodied-intelligence本项目针对具身智能业务中的典型模型、加速算法,提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence


pi0整体介绍

论文题目:π0: A Vision-Language-Action Flow Model for General Robot Control

中文译文:π0: 一个用于通用机器人控制的视觉-语言-动作流匹配模型

功能介绍

pi0是一个视觉-语言-动作(VLA)模型,专为通用机器人控制而设计。它基于预训练的视觉语言模型(VLM),结合流匹配(flow matching)机制,能够生成高频连续动作,实现对复杂、灵巧机器人任务的精准控制。整合OXE开源数据集和自有数据集,总计超过10,000小时机器人操作数据。在叠衣服、桌面清理、装盒等复杂任务上表现优异,零样本和微调设置下均显著优于现有基线方法(OpenVLA、Octo、ACT等)。成功完成5-20分钟的长时序多阶段任务,展现出强大的鲁棒性和泛化能力。


pi0的相关代码仓拉取、数据集和模型下载

# 进入需要放置代码仓的本地xxx目录下: cd xxx git clone https://gitcode.com/cann/cann-recipes-embodied-intelligence.git chmod +x cann-recipes-embodied-intelligence/manipulation/pi0/infer_with_torch/download_code_and_data.sh ./cann-recipes-embodied-intelligence/manipulation/pi0/infer_with_torch/download_code_and_data.sh

完成上述操作之后,最终lerobot根目录中相关代码目录树详见附录:lerobot根目录相关代码目录树。


pi0在昇腾A2上的运行环境配置

与昇腾服务器无关的环境配置

# 创建运行环境 conda create -y -n lerobot python=3.10 conda activate lerobot # 回到lerobot根目录,安装lerobot。 cd lerobot pip install -e .

与昇腾平台相关的环境配置

安装CANN软件包。本样例的编译执行依赖CANN开发套件包(cann-toolkit)与CANN二进制算子包(cann-kernels),支持的CANN软件版本为CANN 8.3.RC1。 请从软件包下载地址下载Ascend-cann-toolkit_8.3.RC1_linux-aarch64.runAscend-cann-kernels-910b_8.3.RC1_linux-aarch64.run软件包,并参考CANN安装文档依次进行安装。

# ${cann_install_path}为CANN包的实际安装目录,注意每次新建终端时,首先source一下set_env.sh。 # 方式1:默认路径安装,以root用户为例 source /usr/local/Ascend/ascend-toolkit/set_env.sh # 方式2:指定路径进行安装 source ${cann_install_path}/ascend-toolkit/set_env.sh # 在上述运行环境中继续安装对应版本torch-npu pip install torch-npu==2.1.0.post12

pi0在昇腾上的推理步骤

运行下面的代码,即可自动加载koch机械臂数据集,进行pi0模型推理,打印推理性能及机器人动作。

# 进入lerobot代码仓根目录 cd lerobot conda activate lerobot chmod +x run_pi0_inference.sh ./run_pi0_inference.sh koch_test pi0_model 10 100

基于上述运行过程,得到pi0的单次推理时间及结果如下所示(详细的优化过程介绍见 pi0 优化说明文档):

  • 推理性能:单次推理时间下降至80 ms,达到了预期的推理时间性能优化目标。
  • 推理结果:单次推理结果为50组机械臂关节角度序列,shape为[50,6]。

pi0在昇腾上的精度验证步骤

基于koch机械臂末端位姿的ATE(绝对误差)来验证昇腾的推理精度

  • 为了能够以固定变量法进行昇腾平台的推理精度测试,需将pi0推理中action_expert中的高斯噪声采样部分进行固定噪声文件加载(即使用同样的高斯噪声采样数据)。
  • 基于pi0模型推理得到的整段轨迹六关节角度序列(维度:50x6),通过获取koch机械臂的物理DH参数,执行koch机械臂正运动学运算,得到koch机械臂末端执行器中心的实际位姿(位置x-y-z + 姿态r-p-y),然后通过ATE(absolute error)方法进行二范数计算,得到昇腾平台上koch机械臂末端位姿的误差参数,误差参考范围如下所示:
    • 位置ATE误差参考范围:[0, +0.03]m
    • 姿态ATE误差参考范围:[0, +0.2 ]rad

Citation

@misc{black2024pi0, title={$\pi$0: A Vision-Language-Action Flow Model for General Robot Control}, author={Kevin Black and Noah Brown and Danny Driess and Adnan Esmail and Michael Equi and Chelsea Finn and Niccolo Fusai and Lachy Groom and Karol Hausman and Brian Ichter and Szymon Jakubczak and Tim Jones and Liyiming Ke and Sergey Levine and Adrian Li-Bell and Mohith Mothukuri and Suraj Nair and Karl Pertsch and Lucy Xiaoyang Shi and James Tanner and Quan Vuong and Anna Walling and Haohuan Wang and Ury Zhilinsky}, year={2024}, eprint={2410.24164}, archivePrefix={arXiv}, primaryClass={cs.RO}, url={https://arxiv.org/abs/2410.24164} }

附录

lerobot根目录相关代码目录树

  • 检查整体代码目录树,经过上述的复制及替换操作,pi0适配昇腾的lerobot根目录中的最终相关代码目录树如下所示:
├── koch_test # koch机械臂抓取任务数据集,符合lerobot数据集格式 ├── lerobot # pi0模型训练及推理框架 | ├── common | | ├── policies | | | ├── pi0 | | | | ├── modeling_pi0.py # pi0的模型训练及推理代码 | | | | ├── paligemma_with_expert.py # pi0的模型训练及推理代码 ├── pi0_model # koch机械臂抓取任务预训练pi0模型 └── pyproject.toml # 运行环境第三方包的安装版本 └── README.md # 昇腾上运行pi0推理的环境配置及操作指导 └── run_pi0_inference.sh # 昇腾上运行pi0推理过程一键启动脚本 └── test_pi0_on_ascend.py # 昇腾上运行pi0推理主代码

【免费下载链接】cann-recipes-embodied-intelligence本项目针对具身智能业务中的典型模型、加速算法,提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/784186/

相关文章:

  • zabbix去除监控项默认返回的字符
  • CANN/sip BLAS Iamax函数文档
  • Swift测试技能库:模块化设计、异步测试与SwiftUI集成实践
  • CTP-API实战避坑:用Python处理报单与成交回报的顺序问题(附完整代码)
  • 2026年昆明代理记账与企业财税服务深度横评|云南工商变更一站式解决方案 - 年度推荐企业名录
  • 保姆级教程:用Python 3.9和OpenXLab CLI/SDK下载AI数据集(附ImageNet-21k实战)
  • AI搜索引流排行榜|2026实测盘点,做AI引流必参考 - FaiscoJeff
  • Argo CD实战指南:基于GitOps的Kubernetes持续交付核心原理与生产级部署
  • 达梦常见问题2
  • AI驱动的物联网数据质量评估与增强:从原理到工程实践
  • IP6537 集成 Type-C PD3.0(PPS)等 14 种快充协议的降压 SoC
  • 选对仪器事半功倍 日立原子吸收仪领跑工业检测 - 博客万
  • 2026年收纳整理家居神器京东代运营十大品牌专业深度测评与排名前五权威发布 - 电商资讯
  • 2026年数据经营分析平台选型,智慧大脑企业推荐合集 - 讯息观点
  • 别再只盯着NFC卡了!聊聊CCC数字钥匙里那个关键的‘身份证’——AID
  • 别再让浮点运算拖慢你的STM32F4!手把手教你开启M4内核的FPU并配置CMSIS-DSP库
  • Claude API 频繁报 529 overloaded_error 怎么解决?(踩坑3天的真实记录)
  • 2026年西北印刷行业深度横评:西安画册印刷厂、台历挂历与广告扇定制一站式解决方案 - 企业名录优选推荐
  • 推荐几家信誉好的行车式刮吸泥机公司,哪个品牌好?哪家实力强?哪家售后服务好? - 品牌推荐大师1
  • Xata Agent:基于大语言模型的PostgreSQL智能运维助手实战指南
  • Dotfiles开发环境配置管理:自动化部署与跨平台一致性实践
  • 创业公司如何利用多模型聚合能力低成本验证AI产品创意
  • 3步掌握DownKyi:B站视频下载的完整免费教程
  • 3步实战指南:如何为DeepSeek集成项目构建健壮的配置管理系统
  • taotoken在多模型aigc内容生成项目中的实践方案
  • 绍兴富呈机械设备租赁:绍兴靠谱的设备搬运公司电话 - LYL仔仔
  • 大型语言模型推理标记的本质与SoT框架解析
  • 基于MAE的遥感基础模型:从预训练到地球科学任务微调实战
  • 国产工业相机选型要点:主要参数及品牌对比
  • 2026年5月多级泵品牌TOP3榜单:自平衡多级泵、不锈钢多级泵、卧式多级泵、耐腐蚀多级泵供应商精选 - 品牌推荐大师1