当前位置: 首页 > news >正文

CANN/asc-devkit矩阵计算实践

Matrix Compute Practices 样例介绍

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

概述

基于 Matrix Compute API 的矩阵计算优化样例,通过<<<>>>直调方式,介绍 Matmul 与 MxFP4 Matmul 在高阶 API、基础 API、Tensor API 场景下的高性能实践。

样例列表

目录名称功能描述支持的产品
matmul_high_performanceMatmul 高阶 API 递进式性能优化样例,展示多核切分、MDL、L1/L2 Cache、常量 tiling、UnitFlag 等优化方法。Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
matmul_basic_api_high_performanceMatmul 基础 API 最佳实践样例,基于静态 Tensor 编程展示基础 API 下的高性能实现细节。Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
matmul_mxfp4_high_performanceMxFP4 Matmul 高阶 API 性能调优样例,展示常量化 tiling 与 scale 数据搬运优化方法。Ascend 950PR / Ascend 950DT
matmul_mxfp4_basic_api_high_performanceMxFP4 Matmul 基础 API 高性能样例,基于静态 Tensor 编程展示已验证的基础 API 实现路径。Ascend 950PR / Ascend 950DT
matmul_mxfp4_tensor_api_high_performanceMxFP4 Matmul Tensor API 高性能样例,基于静态 Tensor 编程展示已验证的 Tensor API 实现路径。Ascend 950PR / Ascend 950DT

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/918813/

相关文章:

  • 12种语言支持:Granite-3.0-2B-Base-GGUF多语言文本生成实战指南
  • AI时代最值钱的能力,不是会写Prompt,而是会验证真相
  • CANN/asc-devkit SIMD向量函数Dump接口
  • HarmonyOS SnapshotUtil 窗口截图与系统截屏监听:snapshot() 和 onSnapshotListener 详解
  • 创业者必看:柳州螺蛳粉技术培训哪家靠谱?实力全测评 - 资讯纵览
  • 树莓派Pico与BMP180传感器:从I2C通信到微型气象站搭建实践
  • 5分钟实战:draw.io桌面版深度构建指南,从源码到跨平台安装包
  • SmolLM2-1.7B-Instruct部署优化:NPU与CPU环境下的性能调优技巧
  • 灵达科技亮相天津智博会,存储互联+高速互联双赛道
  • 告别密密麻麻!ECharts饼图图例太多怎么优雅分页?scroll配置全解析
  • 提升用户体验:gh_mirrors/li/live2d_demo事件触发与交互设计指南
  • 2026南充瑜伽普拉提培训机构深度评测报告 - 资讯纵览
  • 三步轻松备份微信聊天记录:你的数字记忆保险箱 [特殊字符]️
  • ControlNet-XS with Stable Diffusion XL完全指南:从安装到生成高质量图像的简单教程
  • xss-filters实战教程:保护HTML数据与属性的10个最佳实践
  • 186、运动控制中的行业应用:无人机飞控
  • 三协议合一:如何用LuckyLilliaBot打造你的全能QQ机器人助手
  • ACE-Step 1.5 XL Turbo商业授权指南:合法合规使用AI生成音乐的终极攻略
  • 鸣潮自动化工具终极指南:如何实现后台智能战斗与资源收集
  • 基于ESP8266与PI算法的公交车智能限速系统设计与实现
  • DLSS Swapper技术架构深度解析:跨平台游戏DLSS文件管理系统的实现原理
  • 别再让远处的模型糊成一片了!在Unity/UE4里正确开启Mipmap的保姆级教程
  • 日喀则本地专业防水TOP5靠谱推荐:家里漏水不用愁,免费上门不求人。本地最新防水企业资讯:专业师傅持证上门,收费透明无隐藏收费,质保5-10年,售后有保障 - 企业资讯
  • SANA-WM模型架构深度解析:2.6B参数扩散变换器的设计哲学
  • 如何零成本将3D视频变2D?VR-Reversal让你告别VR设备也能享受沉浸体验
  • 房地产AI合规红线清单(含住建部新规+GDPR+生成式AI备案要求),错过即停用
  • 紧急通知:NIST AI RMF 1.1已强制要求部署文档包含风险溯源字段——Gemini文档编写的最后72小时合规补救方案
  • CatPPT部署实战:从本地环境到云端服务的完整配置指南
  • 西安本地专业防水TOP5靠谱推荐:家里漏水不用愁,免费上门不求人。本地最新防水企业资讯:专业师傅持证上门,收费透明无隐藏收费,质保5-10年,售后有保障 - 企业资讯
  • 别再手动调顶点!Unity程序化生成Mesh的5个实战场景(附完整代码)