当前位置: 首页 > news >正文

CANN/asc-devkit多核矩阵乘法缓冲区大小获取

MultiCoreMatmulGetTmpBufSize

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

功能说明

多核Matmul Tiling调用GetTiling接口获取Tiling参数后,根据Tiling结构体信息获取L1 Buffer/Unified Buffer/L0C Buffer的使用大小。

函数原型

int32_t MultiCoreMatmulGetTmpBufSize(optiling::TCubeTiling& tiling, matmul_tiling::SysTilingTempBufSize& bufSize)

参数说明

表1参数说明

参数名输入/输出描述
tiling输入Matmul多核Tiling的结构体,即MultiCoreMatmulTiling对象得到的TCubeTiling结构体。
bufSize输出根据TCubeTiling结构体信息获取L1 Buffer/Unified Buffer/L0C Buffer的使用大小。SysTilingTempBufSize结构定义如下方代码所示。
struct SysTilingTempBufSize { int32_t ubSize = 0; // Unified Buffer大小 int32_t l1Size = 0; // L1 Buffer大小 int32_t l0cSize = 0; // L0C Buffer大小 };

返回值说明

-1表示获取失败; 0表示获取成功。

约束说明

调用示例

auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); matmul_tiling::MultiCoreMatmulTiling tiling(ascendcPlatform); optiling::TCubeTiling tilingData; ... // 初始化tilingData,详见MatmulTiling类使用说明 int ret = tiling.GetTiling(tilingData); // 获取Tiling参数 SysTilingTempBufSize bufSize; MultiCoreMatmulGetTmpBufSize(tilingData, bufSize);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1129952/

相关文章:

  • ComfyUI-WanVideoWrapper架构解析:径向注意力与块交换技术驱动的长视频生成性能优化
  • QMCDecode:解锁QQ音乐加密格式的macOS终极解决方案
  • Umi-OCR:免费离线的文字识别终极解决方案,效率提升300%
  • ripgrep如何重新定义代码搜索范式:从设计哲学到工程实践的解构
  • 血糖数据管理神器:xDrip+ 让糖尿病监测变得简单高效
  • 如何在ComfyUI中快速部署SCAIL-2扩散模型:专业工作流优化指南
  • Python实现TEA加密算法:从原理到逆向识别的实战指南
  • 如何高效构建完整的抖音自动化互动系统:Python机器人实战指南
  • Flutter Planets测试指南:为行星应用编写Widget测试的完整流程
  • 如何优化Varnish Dashboard性能:减少资源消耗的3个关键配置
  • 5个高效技巧:进阶用户如何优化LaTeX-Workshop配置
  • Faster-Whisper终极指南:4倍速语音转录的完整教程
  • 如何在现代电脑上完美运行PS3游戏:RPCS3模拟器终极指南
  • 5分钟搭建专属AI音乐创作平台:Suno-API完全指南
  • 使用C语言实现面向对象程序设计
  • 如何在ComfyUI中快速部署SCAIL-2扩散模型:三种精度版本全解析
  • 一键搞定文档转换:如何用MarkItDown将PDF、Word等数十种格式智能转为Markdown
  • Runno沙盒安全深度剖析:为什么你的代码在浏览器中是安全的
  • cs-wiki揭秘:为什么它能成为后端面试与学习的终极资源
  • Real-Time C++模板元编程实战:提升嵌入式代码性能的10个技巧
  • Scan Tailor终极指南:如何让扫描文档处理效率提升500%
  • 如何快速上手Swirl:Android指纹动画库的5分钟入门教程
  • ZyPlayer:你的个人影视中心,重新定义跨平台观影体验
  • BetterNCM安装器:三步轻松搞定网易云插件安装,新手也能快速上手
  • 终极指南:如何在本地快速部署 abawuwao 图像文本到视频 AI 模型 [特殊字符]
  • WebPShop:让Photoshop原生支持WebP格式的终极解决方案
  • Swirl深度解析:Android指纹动画背后的VectorDrawable技术终极指南
  • 鸣潮自动化助手:5分钟掌握后台智能战斗与资源管理
  • 开源(Open Source)那些事儿 (一)
  • Memcached Session Manager常见问题排查:解决10个典型部署难题