当前位置: 首页 > news >正文

CANN/asc-devkit ReduceMin临时空间接口

GetReduceMinMaxMinTmpSize

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

功能说明

kernel侧ReduceMin接口的计算需要开发者预留/申请临时空间,本接口用于在host侧获取预留/申请的最大最小临时空间大小,开发者基于此范围选择合适的空间大小作为Tiling参数传递到kernel侧使用。

  • 为保证功能正确,预留/申请的临时空间大小不能小于最小临时空间大小。
  • 在最小临时空间-最大临时空间范围内,随着临时空间增大,kernel侧接口计算性能会有一定程度的优化提升。为了达到更好的性能,开发者可以根据实际的内存使用情况进行空间预留/申请。该接口最大临时空间当前等于最小临时空间

函数原型

void GetReduceMinMaxMinTmpSize(const ge::Shape& srcShape, const ge::DataType dataType, ReducePattern pattern, bool isSrcInnerPad, bool isReuseSource, uint32_t& maxValue, uint32_t& minValue)

参数说明

表 1接口参数列表

接口

输入/输出

功能

srcShape

输入

输入的shape信息,参数取值与ReduceMin接口的srcShape参数保持一致。

dataType

输入

输入的数据类型,ge::DataType类型,当前支持的数据类型与ReduceMin接口的模板参数T保持一致。

pattern

输入

用于指定ReduceMin的计算轴。ReducePattern类型,该类型的定义如下,包括Reduce轴和Normal轴。pattern由与输入向量维度数量相同的A、R字母组合形成,字母A表示Normal轴,R表示Reduce轴。该参数的取值与ReduceMin接口的pattern参数保持一致,当前只支持取值为AscendC::ReducePattern::AR,AscendC::ReducePattern::RA。

enum class ReducePattern : uint32_t { AR = 0, RA = 1, R, ARA, ARAR, ARARA, ARARAR, ARARARA, ARARARAR, ARARARARA, RAR, RARA, RARAR, RARARA, RARARAR, RARARARA, };

isSrcInnerPad

输入

表示实际需要计算的最内层轴数据是否32Bytes对齐,参数取值与ReduceMin接口的isSrcInnerPad参数保持一致。

isReuseSource

输入

是否复用源操作数输入的空间,参数取值与ReduceMin接口的isReuseSource参数保持一致。

maxValue

输出

ReduceMin接口能完成计算所需的最大临时空间大小,超出该值的空间不会被该接口使用。

minValue

输出

ReduceMin接口能完成计算所需最小临时空间大小。为保证功能正确,接口计算时预留/申请的临时空间不能小于该数值。

返回值说明

约束说明

调用示例

完整的调用样例请参考更多样例。

// 输入shape为16*32的矩阵;算子输入的数据类型为float;不允许修改源操作数 auto shape = ge::Shape({ 16, 32 }); uint32_t maxValue = 0; uint32_t minValue = 0; bool isSrcInnerPad = true; bool isReuseSource = false; AscendC::GetReduceMinMaxMinTmpSize(shape, ge::DataType::DT_FLOAT, AscendC::ReducePattern::AR, isSrcInnerPad, isReuseSource, maxValue, minValue);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/853185/

相关文章:

  • CANN/asc-devkit SetCurBufSize函数文档
  • CANN/asnumpy随机抽样API
  • 如何通过智能菜单栏管理让Mac界面焕然一新:Hidden Bar深度使用指南
  • Internetarchive元数据管理实战:掌握metadata操作的最佳实践
  • MaxBot抢票机器人:2025终极自动化抢票神器指南,5步轻松搞定热门门票
  • 别再死磕理论了!用SolidWorks从零到一,手把手教你搭建一个能动的三自由度机械臂模型
  • CANN/asc-devkit SetShapeInfo API文档
  • 别再只当Atlas是元数据仓库了!手把手教你用它的UI搞定数据分类与血缘追溯
  • 从DTrace到SystemTap:一个开源内核追踪工具的“逆袭”与避坑指南
  • 如何高效使用FreeRDP:远程桌面连接实用技巧完整指南
  • 青龙面板终极指南:多语言定时任务管理平台完整实战教程
  • 3步搞定Fan Control风扇控制:Windows电脑散热优化专业指南
  • FastCopy终极指南:跨平台文件复制的完整解决方案
  • 为ClaudeCode配置Taotoken作为备用API源防止服务中断
  • Taotoken用量看板功能详解如何帮助团队管理员透明化管理AI资源开支
  • 告别实车折腾!手把手教你用Vector VT平台搭建OBC/DCDC的HIL测试台架(附避坑清单)
  • 从Word转投LaTeX:我用这套Windows环境配置,论文排版效率翻倍了
  • 如何快速使用Pixelle-Video:面向初学者的AI短视频生成完整指南
  • 手把手教你为OpenHarmony RK3568板子配置musl+Clang交叉编译环境(含pkg-config详解)
  • 如何轻松掌握网页资源下载:开源猫抓插件的终极指南 [特殊字符]
  • CANN/asc-devkit CumSum临时空间接口
  • OpCore-Simplify:如何30分钟完成专业级黑苹果配置
  • PyTorch矩阵乘法进阶:用torch.matmul高效实现一个简易的Transformer注意力头
  • CANN/asc-devkit GlobalTensor地址获取
  • 联想拯救者工具箱终极指南:完全替代Vantage的轻量级硬件管理方案
  • 用CUDA C++手搓LeNet推理引擎:从PyTorch导出权重到GPU加速的完整流程(附源码)
  • (良心整理)亲测好用的AI写作辅助网站,毕业党收藏备用
  • DDR接口时序约束:为何无需设置set_input_delay?
  • 5分钟上手Translumo:Windows上最强的实时屏幕翻译工具
  • 通过 curl 命令快速测试 Taotoken 大模型接口连通性