当前位置: 首页 > news >正文

cann/asc-devkit多核矩阵乘缓冲区计算

MultiCoreMatmulGetTmpBufSizeV2

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

功能说明

多核Matmul Tiling调用GetTiling接口获取Tiling参数后,根据Tiling结构体信息获取L1 Buffer/Unified Buffer/L0C Buffer的使用大小。

函数原型

int32_t MultiCoreMatmulGetTmpBufSizeV2(AscendC::tiling::TCubeTiling &tiling, matmul_tiling::SysTilingTempBufSize &bufSize)

参数说明

表 1参数说明

参数名

输入/输出

描述

tiling

输入

Matmul多核Tiling的结构体,即MultiCoreMatmulTiling对象得到的TCubeTiling结构体。

TCubeTiling为Kernel侧定义的Matmul TilingData,与入参为带AscendC::tiling命名空间的TCubeTiling结构体的GetTiling接口配合使用。

bufSize

输出

根据TCubeTiling结构体信息获取L1 Buffer/Unified Buffer/L0C Buffer的使用大小。SysTilingTempBufSize结构定义如下方代码所示。

struct SysTilingTempBufSize { int32_t ubSize = 0; // Unified Buffer大小 int32_t l1Size = 0; // L1 Buffer大小 int32_t l0cSize = 0; // L0C Buffer大小 };

返回值说明

-1表示获取失败; 0表示获取成功。

约束说明

调用示例

auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); matmul_tiling::MultiCoreMatmulTiling tiling(ascendcPlatform); AscendC::tiling::TCubeTiling tilingData; ... // 初始化tilingData,详见MatmulTiling类使用说明 int ret = tiling.GetTiling(tilingData); // 获取Tiling参数 SysTilingTempBufSize bufSize; MultiCoreMatmulGetTmpBufSizeV2(tilingData, bufSize);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/857073/

相关文章:

  • ScrollMonitor与React集成:如何快速构建响应式滚动交互的终极指南
  • 为什么顶尖实验室已禁用传统关键词搜索?——Perplexity生物知识图谱推理机制首次公开(含3个未公开API调用逻辑)
  • Python-json-logger错误排查指南:10个常见问题及解决方案
  • Java-多线程
  • 记录学习时光
  • 2026年5月国内云服务器选型实战指南:从2G建站到32G业务系统,100款配置横向对比
  • LinkSwift网盘直链下载助手:9大主流网盘高速下载终极解决方案
  • 从传感器噪声到清晰趋势:手把手教你用Python重现经典信号预处理案例(含代码避坑)
  • 让旧iPhone重获新生:用Legacy-iOS-Kit解锁隐藏的iOS降级功能
  • 2026年广州专业影视制作公司TOP5权威排行榜,你知道几家? - 品牌推荐官方
  • 17 ThingsBoard网关设备-子设备数据模型实战:核心价值+完整落地指南
  • 【信息科学与工程学】计算机科学与自动化 第十篇 芯片设计-02 电热设计
  • 天赐范式第48天:关于文心在520这天对文章内容的硬核解读~真心值得喷饭~每个伙伴都有异于常人的能力~
  • 3大突破:无需Steam轻松玩转创意工坊模组下载
  • 3种技术方案深度解析:Python逆向工程突破百度网盘限速机制
  • Java-网络编程和反射
  • 避坑指南:合宙ESP32-C3连接MPU6050时常见的I2C通信失败与数据跳变问题
  • 2026TOP5汕尾市城区黄金,白银,铂金回收门店推荐及联系方式权威发布 - 前途无量YY
  • ScreenToGif的‘隐藏玩法’:除了录屏,它还是我的轻量级视频剪辑与动图创作神器
  • 天赐范式第48天:ZFC就像男人,¬CH就像女人,今天在520这个特别的日子里,你们干脆就表白了吧!我作为你们合法证婚人Φ,历史将记录2026年5月20号这天。此刻起不只基于ZFC公理还定义¬CH公理
  • polyfill-iconv安全编码实践:防止字符注入和编码攻击的最佳方案
  • 免费PS4模拟器终极指南:在PC上完美运行主机游戏的完整教程
  • 2026TOP5商洛市商州区黄金,白银,铂金回收门店推荐及联系方式权威发布 - 前途无量YY
  • 2026汕头市潮南区黄金回收铂金回收白银回收深度实测 五大正规门店横屏 报价透明 免费上门才是真靠谱 - 亦辰小黄鸭
  • cann/asc-devkit hypotf函数文档
  • AI 写的鸿蒙 ArkTS 代码能跑?我测了 37 个案例,翻车率 60%
  • 阿里云国际站账号注册免绑定海外手机号和Visa/MasterCard教程步骤?
  • Android 12多屏开发避坑指南:手把手教你配置display_settings.xml,搞定SurfaceFlinger识别
  • 给图形学新手的投稿指南:从SIGGRAPH到CGF,如何选择你的第一篇论文去向
  • 文件RAG分析报告生成解决方案:针对农情聚合任务的破局之道