当前位置: 首页 > news >正文

CANN PyPTO并行Tensor编程框架

PyPTO

【免费下载链接】pyptoPyPTO(发音: pai p-t-o):Parallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto

🔥最新动态

  • 2026/04/10:0.2.0版本发布,变更前端表达方法,提升易用性、增强功能及性能,完善各模块能力,优化开发体验与运行效率
  • 2026/03/30:v0.1.2版本发布,支持集群训练场景、优化框架编译性能与基础性能、修复已知整网集成问题
  • 2026/03/09:v0.1.1版本发布,支持新前端、进一步增加API丰富程度、修复一些已知问题
  • 2026/01/06:v0.1.0版本发布,PyPTO项目初始版本
  • 2025/12:PyPTO项目首次上线。

🚀概述

PyPTO(发音:pai p-t-o)是一款面向AI加速器的高性能编程框架,旨在简化复杂融合算子乃至整个模型网络的开发流程,同时保持高性能计算能力。该框架采用创新的PTO(Parallel Tensor/Tile Operation)编程范式,以基于Tile的编程模型为核心设计理念,通过多层次的中间表示(IR)系统,将用户通过API构建的AI模型应用从高层次的Tensor图逐步编译成硬件指令,最终生成可在目标平台上高效执行的可执行代码。

本仓已集成代码仓库智能体,点击徽章,进入其专属页面,开启在线智能代码学习与知识问答体验!

核心特性

  • 基于 Tile 的编程模型:所有计算都基于Tile(硬件感知的数据块)进行,充分利用硬件并行计算能力和内存层次结构
  • 多层级计算图转换:通过编译Pass将Tensor Graph转换为Tile Graph、Block Graph和Execution Graph,每一步包括一系列Pass优化流程
  • 自动化代码生成:编译结果通过CodeGen生成底层PTO虚拟指令代码,再通过编译器将虚拟指令代码编译成目标平台的可执行代码
  • MPMD 执行调度:可执行代码被加载到设备侧,通过MPMD(Multiple Program Multiple Data)的方式调度到设备上的处理器核
  • 完整的工具链支持:全流程的编译中间产物和运行时性能数据可通过IDE集成的工具链可视化识别性能瓶颈,开发者也可以通过工具链控制编译和调度行为
  • Python 友好 API:提供直观的Tensor级别抽象,贴近算法开发者的思维模式,支持动态Shape和符号化编程
  • 分层抽象设计:对不同开发者暴露不同抽象层次,算法开发者使用Tensor层次,性能专家使用Tile层次,系统开发者使用Block层次

目标用户

  • 算法开发者:主要使用Tensor层次编程,快速实现和验证算法,专注于算法逻辑
  • 性能优化专家:可使用Tile或Block层次,进行深度性能调优,以实现极致性能
  • 系统开发者:可在Tensor/Tile/Block和PTO虚拟指令集层次上进行三方框架对接或集成,以及工具链开发

⚡️最佳实践样例

PyPTO提供了丰富的示例代码,涵盖从基础操作到复杂模型实现的多个层级。一些最佳实践样例参考:

大模型实现样例

  • DeepSeekV3.2 SFA -稀疏Flash Attention量化实现
  • DeepSeekV3.2 MLA-PROLOG -MLA Indexer Prolog量化实现
  • GLM V4.5 Attention -GLM注意力机制实现
  • GLM V4.5 ExpertsSelector -GLM专家选择器实现

学习路径

在 examples目录下,我们规划了多个层级的样例:

  • beginner/:基础操作示例,帮助初学者快速上手PyPTO编程
  • intermediate/:中级示例,包括自定义操作、神经网络模块等
  • advanced/:高级示例,包括复杂模式和多函数组合

在 models/目录下,我们提供了部分大模型实现样例,供快速移植和部署

这些示例可以帮助开发者学习如何编写PyPTO算子,从简单的Tensor操作到复杂的模型网络实现。

⚡️快速入门

若您希望快速体验PyPTO的使用和开发过程,请访问如下文档获取简易教程。

  • 环境部署:介绍项目基础环境的搭建,包括软件包和第三方依赖的获取和安装。
  • 编译安装:环境部署后,介绍如何快速获取或编译PyPTO软件包并安装。
  • 样例运行:安装PyPTO软件包后,介绍如何快速实现样例运行。

📖文档资源

若您希望深入体验项目功能并修改源码,请访问如下文档获取详细教程。

  • 文档中心 :当前发布版本的详细文档,包括编程指南、API参考,贡献指南等
  • 示例代码:丰富的示例代码,从基础到高级应用

🔍目录结构

关键目录如下:

├── docs/ # 文档资源 │ ├── api/ # API参考文档 │ ├── contribute/ # 贡献指南文档 │ └── tutorials/ # PyPTO编程指南 │ ├── examples/ # 示例代码 │ ├── 01_beginner/ # 初级示例 │ ├── 02_intermediate/ # 中级示例 │ └── 03_advanced/ # 高级示例 │ ├── models/ # 模型实现示例 │ ├── python/ # Python源码 │ ├── pypto/ # Python包源码根目录 │ ├── src/ # pybind11源码根目录 │ └── tests/ # Python测试用例源码(UTest, STest) │ ├── framework/ # C++源码根目录 │ ├── include/ # C++对外头文件 │ ├── src/ # C++源码 │ │ ├── codegen/ # 代码生成模块 │ │ ├── passes/ # 编译Pass模块 │ │ └── ... │ └── tests/ # C++测试用例源码 │ ├── tools/ # 工具脚本 │ ├── cmake/ # 构建所需的CMake公共配置及脚本 ├── build_ci.py # CI执行构建、执行UTest、执行STest辅助脚本 ├── CMakeLists.txt # 顶层CMakeLists.txt,定义所有对外公开编译开关 ├── pyproject.toml # Python编译工具配置文件 ├── LICENSE # 许可证文件 └── setup.py # Python编译工具脚本文件(setuptools)

📝相关信息

  • 贡献指南
  • 安全声明
  • 许可证

联系我们

  • 问题反馈:通过GitCode【Issues】提交问题
  • 功能建议:通过GitCode【讨论】参与交流
  • 技术支持:参考文档或提交Issue

注意:本文档会持续更新,请关注最新版本。

【免费下载链接】pyptoPyPTO(发音: pai p-t-o):Parallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/783789/

相关文章:

  • CANN/ATVC ReluWithReduceSum样例
  • AI智能体驱动的修仙世界模拟器:规则与LLM融合的自主演化系统
  • 收藏!程序员必备:从传统开发转向AI Agent开发的核心能力跃迁指南
  • 2026数字化展厅策划设计施工运维一站式公司解析 - 品牌排行榜
  • 2026年立式锯床厂家推荐排行榜:金属切割、精密、数控、液压、全自动立式锯床优质品牌之选! - 速递信息
  • Balena Etcher:极致安全的跨平台镜像烧录工具深度解析
  • 1Panel应用生态不够用?试试这个开源第三方商店(附自动同步脚本配置)
  • CANN ops-math Fill算子
  • 云原生架构重塑医疗影像:从数据孤岛到联邦学习的智能演进
  • 告别RTT告警:优化Pixhawk与树莓派4B的MAVROS通信性能(实测波特率921600)
  • Grouped Matmul MXFP4量化矩阵乘算子
  • 2026年山西精准获客与短视频代运营深度评测 - 优质企业观察收录
  • 2026实体店智能马桶选购指南:线下买怎么避坑?5大参数+6款横评一次看懂 - charlieruizvin
  • cann-samples分组MXFP8量化矩阵乘
  • CANN PTO-ISA 贡献指南
  • 5步掌握Seraphine:英雄联盟智能战绩查询与自动BP终极指南
  • 评价中心成本高难普及,AI介入能否解决规模与严谨性难题?
  • CANN opbase算子数据Dump接口
  • 2026年消防排烟风机市场规模突破200亿:深胜博实业如何从4家竞品中脱颖而出? - 优质企业观察收录
  • # WTAPI与AI集成:下一代个微自动化解决方案
  • OpenClaw AI 代理 Web 管理面板:可视化运维与集中控制实践
  • AI技能图谱:企业人才管理的动态评估与优化
  • 2026年HENF级板材品牌哪家好 - 品牌排行榜
  • 从2500亿美元估值到消名,xAI消失背后指向SpaceX世纪IPO
  • CANN ATC模型转换指南
  • CANN/cann-recipes-infer压缩FlashAttention算子
  • CANN电力负荷预测ReduceAll算子
  • OpenAI Cookbook:从API调用到AI工程化落地的实用指南
  • 对比两个版本代码差异
  • 在Node.js后端服务中集成Taotoken实现稳定AI能力