CANN/asc-devkit CumSum临时空间接口
GetCumSumMaxMinTmpSize
【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit
功能说明
kernel侧CumSum接口的计算需要开发者预留/申请临时空间,本接口用于在host侧获取预留/申请的最大和最小临时空间大小,开发者基于此范围选择合适的空间大小作为Tiling参数传递到kernel侧使用。
- 为保证功能正确,预留/申请的临时空间大小不能小于最小临时空间大小。
- 在最小临时空间-最大临时空间范围内,随着临时空间增大,kernel侧接口计算性能会有一定程度的优化提升。为了达到更好的性能,开发者可以根据实际的内存使用情况进行空间预留/申请。
函数原型
void GetCumSumMaxMinTmpSize(const ge::Shape& srcShape, const uint32_t typeSize, const bool isLastAxis, const bool isReuseSource, uint32_t& maxValue, uint32_t& minValue)参数说明
表 1参数说明
Cumsum接口能完成计算所需的最大临时空间大小,超出该值的空间不会被该接口使用。 请注意,maxValue仅作为参考值,有可能大于Unified Buffer剩余空间的大小,该场景下,开发者需要根据Unified Buffer剩余空间的大小来选取合适的临时空间大小。 | ||
返回值说明
无
约束说明
- 操作数地址对齐要求请参见通用地址对齐约束。
- 输入input只支持二维结构。
调用示例
// 输入shape为32*32的矩阵;算子输入的数据类型为half;isLastAxis传入默认值true,isReuseSource传入默认值false uint32_t firstDim = 32; uint32_t lastDim = 32; std::vector<int64_t> srcShapeDims = {firstDim, lastDim}; auto srcShape = ge::Shape(srcShapeDims); uint32_t maxValue = 0; uint32_t minValue = 0; AscendC::GetCumSumMaxMinTmpSize(srcShape, 2, true, false, maxValue, minValue);【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
