当前位置: 首页 > news >正文

Ascend C开发工具包变更日志

CHANGELOG

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

v9.0.0-beta.2

发布日期:2026/03/31 | CANN版本 | 版本源码标签 | |--|--| | CANN 9.0.0-beta.2 |

🚀 关键特性

  • Ascend 950PR支持SIMD编程模式,提供200+ API接口跨代兼容能力,可实现Atlas A2系列产品和Atlas A3系列产品算子平滑迁移。
  • Ascend 950PR新增基于Reg的编程方式,提供Reg数据搬运、基础算术、规约计算、同步控制等90+ Reg编程接口。
  • Atlas A2系列产品、Atlas A3系列产品、Ascend 950PR支持语言扩展层纯C接口,支持数组式内存分配与指针型计算接口,提供原生纯 C 编程体验。
  • Ascend 950PR支持SIMD与SIMT混合编程,提供约700个SIMT API接口,包含warp、atomic、基本数学计算、类型转换等基础接口。
  • Ascend 950PR支持通信高阶API的CCU通信接口,提供基于CCU的Allreduce,Allgather,Reducescatter,AlltoAll等主流通信原语;Matmul高阶API新增支持MXFP4/8低比特数据类型的矩阵运算,实现内存占用减半、算力吞吐倍增。
  • Ascend 950PR新增及兼容支持样例共计约260个,包含SIMT样例、SIMD样例(框架类、基础API、高阶API、最佳实践等),并按照编程模型和样例类别对样例目录结构进行调整,提升样例目录结构的易读性。
  • 融合编译与<<<>>>调用方式支持CPU模式以及SIM仿真模式。

📖 资料文档

  • 新增90+ Reg编程接口API资料,Reg矢量计算API是面向RegBase架构开发的API,用户可通过该API直接对芯片中涉及Vector计算的寄存器进行操作,实现更大的灵活性和更好的性能。
  • 新增SIMT快速入门、编程模型和算子实现介绍。
  • 新增SIMD与SIMT混合编程模型、算子实现、性能优化介绍。
  • 新增SIMT API资料章节。
  • 新增兼容性迁移指南(220x架构版本迁移到351x架构版本)。
  • 昇腾社区中,Ascend C算子开发新增可视化专区,通过视频呈现Cube和Vector算子的执行过程。

v9.0.0-beta.1

发布日期:2026/02/25 | CANN版本 | 版本源码标签 | |--|--| | CANN 9.0.0-beta.1 |

🚀 关键特性

  • 完成Gitee样例仓的迁移,并统一使用<<<>>>调用方式;
  • 融合编译与<<<>>>调用方式支持CPU模式以及SIM仿真模式。
  • Ascend C项目新增对Kirin X90和Kirin 9030处理器的支持。鸿蒙开发者基于Ascend C的实践案例可参考:cann-recipes-harmony-infer。

v8.5.0

发布日期:2026/01/23 | CANN版本 | 版本源码标签 | |--|--| | CANN 8.5.0 |

🚀 关键特性

基于Atlas A3 训练系列产品/Atlas A3推理系列产品、Atlas A2训练系列产品/Atlas A2推理系列产品全面开源开放,包含以下新特性:

  • 实现分仓分包,支持分包独立安装部署,包括Ascend C算子开发所需的核心仓asc-devkit、调试工具仓asc-tools、Vector算子模板库仓atvc和atvoss、Python前端仓pyasc。
  • 编程API能力扩展
    • 新增语言扩展层C API,提供与业界相似的编程体验。
    • 基础API新增LocalMemAllocator内存分配接口。
  • 全面支持异构编译与<<<>>> 直调,通过文件后缀名“.asc”或编译选项“-x asc”使能异构编译。
  • 算子编译CMake接口标准化,提供Cmake module接口,支持不同编译场景。
  • 支持CPU&NPU孪生调试的能力一致性,一套代码同时支持CPU和NPU调试。
  • 编程指南全面优化。
  • 新增算子样例。

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/785134/

相关文章:

  • natbot部署指南:如何快速配置本地与服务器环境的GPT-3浏览器控制工具
  • 1-论面向对象的建模及应用
  • Source Han Serif CN:构建专业中文排版系统的完整方案
  • mac 安装指定node版本
  • DAMAS框架:基于多智能体系统与ABM的分布式欺骗建模与分析
  • 2026年4月水处理工程推荐,反渗透水处理/去离子水处理/超纯水处理/生活污水处理/污水处理,水处理厂家推荐 - 品牌推荐师
  • CANN/runtime Kernel加载与执行
  • 为 Claude Code 配置 Taotoken 作为替代 API 服务商解决封号困扰
  • CubiFS分布式存储错误处理终极指南:10个最佳实践让数据安全无忧
  • 打造高可靠性WiFi中继器:esp_wifi_repeater看门狗定时器与故障恢复机制终极指南
  • AI系统安全实战:防御黑盒攻击与模型窃取的纵深策略
  • CANN/sip Cgemm复数矩阵乘法
  • 宁波地区专业的银行活动策划生产厂家找哪家 - GrowthUME
  • Linux Mem -- 通过reserved-memory缩减内存
  • 前端高级开发工程师面试准备一
  • 【GitHub】SuperClaude Framework深度解析:将Claude Code打造为专业开发平台的元编程配置框架
  • AI 术语通俗词典:偏导数
  • 量子机器学习新范式:Classiq如何简化QML模型开发
  • 大众认为花钱进修一定能升职加薪,编程统计进修投入,职业晋升数据,无用进修只会增加个人经济负担。
  • 构建AI教育互操作生态:从数据孤岛到标准化学习系统
  • 沈阳本地CPPM官方授权报名中心及联系方式 - 众智商学院课程中心
  • SLING实战:如何构建自己的知识抽取系统
  • 管程与线程:从操作系统到编程语言
  • Sanic中间件链优化终极指南:构建高性能请求处理流水线
  • CANN驱动HBM厂商查询
  • 物理模拟算法Algorithms39:刚体动力学与碰撞检测终极指南
  • 终极BullshitGenerator语料库解析:解锁100+名人名言的高效使用指南
  • 如何理解KityMinder脑图编辑器的模块化命令系统设计原理 [特殊字符]
  • 深耕北京暖居,铸就品质标杆——宝鹿散热器品牌全解析 - GrowthUME
  • 地学基础模型:构建地球科学通用AI大脑的技术架构与实践