当前位置: 首页 > news >正文

CANN/asc-devkit Matmul计算方向设置API

SetTraverse

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

功能说明

设置固定的Matmul计算方向,M轴优先还是N轴优先。

函数原型

int32_t SetTraverse(MatrixTraverse traverse)

参数说明

表 1参数说明

参数名

输入/输出

描述

traverse

输入

设置固定的Matmul计算方向。可选值:MatrixTraverse::FIRSTM/MatrixTraverse::FIRSTN。

FIRSTM代表先往M轴方向偏移再往N轴方向偏移。

FIRSTN代表先往N轴方向偏移再往M轴方向偏移。

返回值说明

-1表示设置失败;0表示设置成功。

约束说明

调用示例

auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); matmul_tiling::MatmulApiTiling tiling(ascendcPlatform); tiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetBType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetCType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetBiasType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetShape(1024, 1024, 1024); tiling.SetOrgShape(1024, 1024, 1024); tiling.SetBias(true); tiling.SetTraverse(MatrixTraverse::FIRSTM); // 设置遍历方式 tiling.SetBufferSpace(-1, -1, -1); optiling::TCubeTiling tilingData; int ret = tiling.GetTiling(tilingData);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/793363/

相关文章:

  • CANN/ops-nn 去量化SwiGLU量化算子
  • CPLD在键盘扩展中的低功耗设计与实现
  • 【信息科学与工程学】【通信工程】第二篇 网络的主要算法03 主要函数(1)L1物理层函数<3>
  • 【审计专栏-监督监管领域】【信息科学与工程学】【社会科学】第十篇 社会底层核心规则(核心权力、核心利益、核心资源绑定、私下运作、关键价值交换、上下博弈)04
  • 基于SpringBoot的鲜花在线订花平台毕业设计源码
  • CANN/asc-devkit截断函数API文档
  • CANN/ops-nn三维平均池化反向传播算子
  • 通过 Taotoken 的 Token Plan 套餐在 Ubuntu 长期项目中实现预算可控
  • 【C++笔记】-- 七种排序流食般讲解
  • CLI桥接器设计:用Go实现开源工具一键安装与跨平台管理
  • CANN/asc-devkit SetValue API文档
  • 可配置处理器技术:嵌入式SOC设计的灵活加速方案
  • CANN/asc-devkit ReduceProd API文档
  • 开始添加性别+年龄自动识别系统
  • CANN/ops-nn: 原位加法RMS归一化算子
  • 《零基础学GPU KMD》专栏简介
  • Weaviate向量数据库实战:从官方示例到RAG应用开发全解析
  • 2018-11至2025-9 71个主要城市商品房租金均价数据(xlsx)
  • ARM CP15寄存器详解与底层开发实践
  • 【信息科学与工程学】计算机科学与自动化-——第十五篇云计算12- 裸金属
  • LInux常用指令(个人查询用)
  • CANN/ops-nn动态块MX量化算子
  • Payum实战案例:构建支持多种支付方式的电商平台完整指南 [特殊字符]
  • 3D堆叠封装技术:热挑战与优化方案
  • 【数据结构】与排序算法鏖战5天,我终于搞懂了排序的思路和实现--排序算法大全的保姆级攻略
  • 动态紧凑模型在电子热设计中的高效应用
  • ARM GICv3中断控制器与ICC_EOIR1寄存器详解
  • Paris注解处理器深度解析:从@Style到@StyleableChild的完整实现原理
  • 虽然市面上已经有人流量统计摄像头----但是我有价格优势
  • 12,Springboot3+vue3实现系统公告功能