当前位置: 首页 > news >正文

CANN/asc-devkit:ReduceAll临时空间大小获取

GetReduceAllMaxMinTmpSize

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

功能说明

kernel侧ReduceAll接口的计算需要开发者预留/申请临时空间,本接口用于在host侧获取预留/申请的最大最小临时空间大小,开发者基于此范围选择合适的空间大小作为Tiling参数传递到kernel侧使用。

  • 为保证功能正确,预留/申请的临时空间大小不能小于最小临时空间大小。
  • 在最小临时空间-最大临时空间范围内,随着临时空间增大,kernel侧接口计算性能会有一定程度的优化提升。为了达到更好的性能,开发者可以根据实际的内存使用情况进行空间预留/申请。该接口最大临时空间当前等于最小临时空间

函数原型

void GetReduceAllMaxMinTmpSize(const ge::Shape& srcShape, const ge::DataType dataType, ReducePattern pattern, bool isSrcInnerPad, bool isReuseSource, uint32_t& maxValue, uint32_t& minValue)

参数说明

表 1接口参数列表

接口

输入/输出

功能

srcShape

输入

输入的shape信息,参数取值与ReduceAll接口的srcShape参数保持一致。

dataType

输入

输入的数据类型,ge::DataType类型,当前支持的数据类型与ReduceAll接口的模板参数T保持一致。

pattern

输入

用于指定ReduceAll的计算轴。ReducePattern类型,该类型的定义如下,包括Reduce轴和Normal轴。pattern由与输入向量维度数量相同的A、R字母组合形成,字母A表示Normal轴,R表示Reduce轴。该参数的取值与ReduceAll接口的pattern参数保持一致,当前只支持取值为AscendC::ReducePattern::AR,AscendC::ReducePattern::RA。

enum class ReducePattern : uint32_t { AR = 0, RA = 1, R, ARA, ARAR, ARARA, ARARAR, ARARARA, ARARARAR, ARARARARA, RAR, RARA, RARAR, RARARA, RARARAR, RARARARA, };

isSrcInnerPad

输入

表示实际需要计算的最内层轴数据是否32Bytes对齐,参数取值与ReduceAll接口的isSrcInnerPad参数保持一致。

isReuseSource

输入

是否复用源操作数输入的空间,参数取值与ReduceAll接口的isReuseSource参数保持一致。

maxValue

输出

ReduceAll接口能完成计算所需的最大临时空间大小,超出该值的空间不会被该接口使用。

minValue

输出

ReduceAll接口能完成计算所需最小临时空间大小。为保证功能正确,接口计算时预留/申请的临时空间不能小于该数值。

返回值说明

约束说明

调用示例

完整的调用样例请参考更多样例。

// 输入shape为16*32的矩阵;算子输入的数据类型为float;不允许修改源操作数 auto shape = ge::Shape({ 16, 32 }); uint32_t maxValue = 0; uint32_t minValue = 0; bool isSrcInnerPad = true; bool isReuseSource = false; AscendC::GetReduceAllMaxMinTmpSize(shape, ge::DataType::DT_FLOAT, AscendC::ReducePattern::AR, isSrcInnerPad, isReuseSource, maxValue, minValue);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/853293/

相关文章:

  • NET如何实现向量语义分析
  • 分布式事务解决方案TCC实战
  • 2026实测:专业降AI率软件选这款就对了3秒改写无痕迹
  • 顶伯在线语音工具支持哪些音色?超全列表 + 试听指南
  • 3个步骤在macOS上运行Windows软件:Whisky让你告别虚拟机束缚
  • 想要在Windows电脑上直接运行安卓应用?APK安装器帮你实现跨平台梦想!
  • AD画完板子别急着下单!5分钟搞定DRC规则检查,避开这些坑才能顺利发嘉立创
  • Django 从 0 到 1 打造完整电商平台:项目基础配置与静态文件处理
  • 【性能倍增】GLM-4V-9B五大生态工具链:从基础部署到多模态应用全攻略
  • YOLO-ONNX-Java 性能监控指标全面解析
  • 别再瞎调了!用PyTorch实战告诉你Momentum、Learning Rate和Weight Decay到底怎么配
  • 2026年登封少林武术学校参考指南:登封市少林鹅坡武术学校、专注文武双修、传承少林文化 - 海棠依旧大
  • 9大主流网盘直链解析工具:LinkSwift下载效率革命
  • Windows 11优化效果测试终极指南:基准测试工具使用完全教程
  • python的虚拟环境和anaconda
  • 2026年智能研磨设备优质厂家推荐:东莞鑫鼎盛专注精密研磨技术、高速离心研磨机、干式溜光机、磁力研磨机、涡流式研磨机、助力制造业表面处理升级 - 海棠依旧大
  • 2026年精密研磨设备厂家最新推荐榜:高速离心研磨/干式溜光/磁力研磨/涡流式研磨/抛光光亮剂 - 海棠依旧大
  • CANN Spack Package故障排除手册:解决AI环境部署中的常见问题
  • Virtual ZPL Printer:基于以太网的虚拟斑马打印机解决方案
  • 从蓝牙时钟到通用Timer:详解非32位满量程下的时间回环处理技巧
  • 别再截图了!用AD21把PCB 3D模型直接塞进PDF,客户评审一目了然
  • Linux驱动开发学习---移植uboot、内核及根文件系统
  • STM32 FSMC驱动8080液晶屏:地址映射、时序配置与避坑指南
  • 2026年石家庄墙布服务优质商家参考:长安区馨妍建筑装饰材料商行,石家庄贴墙布、老房翻新贴墙布、新房装修贴墙布,以专业服务守护家装墙面质感 - 海棠依旧大
  • 2026年5月最新 农业灌溉超声波液位计选型:国产与进口对比 - 仪表品牌榜
  • 5分钟搞定AI背景移除!OBS虚拟背景插件终极使用指南
  • 3D-FAMM:模块化模具技术如何革新微流控芯片的快速原型开发
  • 如何用ImageToSTL将平面图片变为3D打印模型:完整指南
  • JavaQuestPlayer深度解析:QSP游戏开发与运行平台的技术实现与实战指南
  • 甄选厦门优质开发团队 打造放心小程序定制服务 - 软件测评师