当前位置: 首页 > news >正文

cann/asc-devkit Asin缓冲区因子大小接口

GetAsinTmpBufferFactorSize

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

功能说明

该接口用于获取maxLiveNodeCount和extraBuf,在固定空间大小的情况下,通过maxLiveNodeCount和extraBuf可以推算算子单次最大计算元素数量。maxLiveNodeCount表示临时空间是单次计算数据量所占空间的多少倍;extraBuf表示使用的额外临时空间大小。

推算示例如下:

  • 算子实现需要调用Asin接口,开发者为其预留currBuff大小的空间,利用GetAsinTmpBufferFactorSize接口得到maxLiveNodeCount、extraBuf输出值,可推导算子单次最大计算元素数量为:

    currentShapeSize = (currBuff - extraBuf) / maxLiveNodeCount / typeSize

  • 算子实现需要调用两个kernel侧API KernelIntf1、KernelIntf2,利用两个GetXxxTmpBufferFactorSize(其中Xxx为需要调用的两个高阶API)接口的两组输出值(maxLiveNodeCount、extraBuf)以及当前现有的临时空间,推导单次最大计算元素数量currentShapeSize为:

    currentShapeSize1 = (currBuff - extraBuf1) / maxLiveNodeCount1 / typeSize

    currentShapeSize2 = (currBuff - extraBuf2) / maxLiveNodeCount2 / typeSize

    currentShapeSize = min(currentShapeSize1, currentShapeSize2)

注意上文中的currBuff表示接口计算可用的空间,需要去除用户输入输出等空间;另外,接口获取的maxLiveNodeCount值可能为0,计算时需要判断该值非0,避免除零错误。

函数原型

void GetAsinTmpBufferFactorSize(const uint32_t typeSize, uint32_t& maxLiveNodeCount, uint32_t& extraBuffer)

参数说明

表 1参数列表

参数名

输入/输出

功能

typeSize

输入

输入的数据类型大小,单位为字节。比如输入的数据类型为half,此处应传入2。

maxLiveNodeCount

输出

最大存活节点数,表示临时空间是单次计算数据量所占空间的多少倍。

extraBuffer

输出

使用的额外临时空间大小,单位为字节。

返回值说明

约束说明

当利用maxLiveNodeCount,extraBuffer反推出的currentShapeSize * typeSize < 256B时,currentShapeSize按照256B/typeSize的值向上取整。

调用示例

完整的调用样例请参考更多样例。

uint32_t maxLiveNodeCount = 0; uint32_t extraBuf = 0; AscendC::GetAsinTmpBufferFactorSize(typeSize, maxLiveNodeCount, extraBuf);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/853190/

相关文章:

  • ops-collections多线程并发优化终极指南:如何充分利用昇腾硬件资源提升10倍性能 [特殊字符]
  • CANN/asc-devkit SetFmatrix API
  • CANN/asc-devkit获取KFC工作空间内存地址API
  • CSS渐变完全掌握:从基础到高级技巧
  • CANN/asc-devkit ReduceMin临时空间接口
  • CANN/asc-devkit SetCurBufSize函数文档
  • CANN/asnumpy随机抽样API
  • 如何通过智能菜单栏管理让Mac界面焕然一新:Hidden Bar深度使用指南
  • Internetarchive元数据管理实战:掌握metadata操作的最佳实践
  • MaxBot抢票机器人:2025终极自动化抢票神器指南,5步轻松搞定热门门票
  • 别再死磕理论了!用SolidWorks从零到一,手把手教你搭建一个能动的三自由度机械臂模型
  • CANN/asc-devkit SetShapeInfo API文档
  • 别再只当Atlas是元数据仓库了!手把手教你用它的UI搞定数据分类与血缘追溯
  • 从DTrace到SystemTap:一个开源内核追踪工具的“逆袭”与避坑指南
  • 如何高效使用FreeRDP:远程桌面连接实用技巧完整指南
  • 青龙面板终极指南:多语言定时任务管理平台完整实战教程
  • 3步搞定Fan Control风扇控制:Windows电脑散热优化专业指南
  • FastCopy终极指南:跨平台文件复制的完整解决方案
  • 为ClaudeCode配置Taotoken作为备用API源防止服务中断
  • Taotoken用量看板功能详解如何帮助团队管理员透明化管理AI资源开支
  • 告别实车折腾!手把手教你用Vector VT平台搭建OBC/DCDC的HIL测试台架(附避坑清单)
  • 从Word转投LaTeX:我用这套Windows环境配置,论文排版效率翻倍了
  • 如何快速使用Pixelle-Video:面向初学者的AI短视频生成完整指南
  • 手把手教你为OpenHarmony RK3568板子配置musl+Clang交叉编译环境(含pkg-config详解)
  • 如何轻松掌握网页资源下载:开源猫抓插件的终极指南 [特殊字符]
  • CANN/asc-devkit CumSum临时空间接口
  • OpCore-Simplify:如何30分钟完成专业级黑苹果配置
  • PyTorch矩阵乘法进阶:用torch.matmul高效实现一个简易的Transformer注意力头
  • CANN/asc-devkit GlobalTensor地址获取
  • 联想拯救者工具箱终极指南:完全替代Vantage的轻量级硬件管理方案