当前位置: 首页 > news >正文

CANN/asc-devkit ScaleAND 布局格式

ScaleANDLayoutFormat

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

ScaleANDLayoutFormat用于定义ScaleAND格式的布局,ScaleAND格式是一种支持缩放的布局,也是一种特殊的ND格式。

结构体定义

template <typename T> struct ScaleANDLayoutFormat { template <size_t row, size_t column> using type = ScaleANDFormatLayout<T, row, column>; template <typename U, typename S> __aicore__ inline decltype(auto) operator()(U row, S column) { return MakeScaleANDLayout<T, U, S>(row, column); } };

参数说明

参数名输入/输出描述
T输入数据类型模板参数。
支持的数据类型为:fp8_e8m0_t。
row输入矩阵的总行数。
column输入矩阵的总列数。

返回值

  • 输入为编译时常量时,返回ScaleAND格式的Layout类型。
  • 输入为整型变量时,返回ScaleAND格式的Layout对象。
  • 返回对齐后的Layout,对齐方式及对应位置的参数大小说明详见Layout和层次化表述法。

约束说明

参数row和column需为size_t类型或Int整型常量。

调用示例

// 创建ScaleAND格式Layout using namespace AscendC::Te; // 根据flag的值,选择ScaleAND格式或ScaleADN格式的类型 constexpr bool flag = true; using MyLayoutType = conditional_t<flag, ScaleANDFormatLayout<fp8_e8m0_t>, ScaleADNFormatLayout<fp8_e8m0_t>>; size_t m = 128; size_t scaleK = 128; auto layoutAL1 = MyLayoutType{}(m, scaleK); // 编译时常量传参构造Layout using MyScaleANDLayout = ScaleANDLayoutFormat<fp8_e8m0_t>::type<Std::Int<32>, Std::Int<64>>; auto staticLayout = MyScaleANDLayout{}; // 运行时变量传参构造Layout ScaleANDLayoutFormat<fp8_e8m0_t> scaleANDFormat; auto layout = scaleANDFormat(32, 64);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/863569/

相关文章:

  • Windows 11 LTSC 2024部署工具深度解析:Rufus绕过在线账户的完整技术指南
  • 终极AMD Ryzen性能调优指南:5分钟掌握SMUDebugTool免费调试神器
  • NoisePage开发环境搭建:从源码编译到调试的完整指南
  • DownGit:3分钟掌握GitHub文件下载的终极指南,无需克隆整个仓库!
  • Vue-antd国际化解决方案:多语言支持与本地化配置详解
  • CANN/asc-devkit TPipe和TQue加法示例
  • Sunshine:打造个人专属游戏云,跨设备畅玩3A大作的终极方案
  • Sunshine游戏串流服务器终极指南:如何10分钟搭建个人云游戏平台
  • React Native Orientation iOS配置完全指南:从Xcode设置到AppDelegate集成
  • 中兴光猫终极解锁指南:3分钟开启工厂模式与永久Telnet
  • 智能盒子-Agent-Skill-执行逻辑架构
  • 华硕笔记本终极控制神器:G-Helper轻量化替代方案完整指南
  • 基于微信小程序实现民大食堂用餐综合服务平台管理系统【内附项目源码+论文说明】
  • 建湖县黄金回收哪家强?铭润稳居第一 - 亦辰小黄鸭
  • 解密速度提升300%:音频格式转换工具深度解析
  • 建宁县黄金回收哪家强?铭润稳居第一 - 亦辰小黄鸭
  • BarrageGrab深度解析:构建多平台实时数据采集工具的技术实现
  • 深度解析:罗技鼠标自动化工具在PUBG中的实战应用
  • QQ空间数据备份指南:三步骤永久保存你的数字青春
  • 鸣潮自动化终极指南:3步开启智能游戏体验
  • QMCDecode:3步解锁QQ音乐加密音频的终极解决方案
  • 《Sysinternals实战指南》进程和诊断工具学习笔记(8.32):谁在占用这个文件?用 Handle 精准搜索、定位并释放锁
  • DLSS Swapper完整指南:3分钟掌握游戏性能优化终极技巧
  • Falco 容器安全监控实践:实时威胁检测
  • 抖音下载终极解决方案:免费高效的douyin-downloader完整使用手册
  • 将乐县黄金回收哪家强?铭润稳居第一 - 亦辰小黄鸭
  • 空洞骑士模组管理器Scarab完整指南:从安装到精通的高效解决方案
  • Kill-Doc:彻底解决在线文档下载难题的浏览器脚本解决方案
  • Python金融数据引擎:重构通达信数据获取的技术范式
  • 端到端智能对话系统架构文档