当前位置: 首页 > news >正文

昇腾C LogicalXor临时空间大小获取

GetLogicalXorMaxMinTmpSize

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

功能说明

Kernel侧LogicalXor接口的计算需要开发者预留/申请临时空间,本接口用于在Host侧获取预留/申请的最大和最小临时空间大小,开发者基于此范围选择合适的空间大小作为Tiling参数传递到Kernel侧使用。

  • 为保证功能正确,预留/申请的临时空间大小不能小于最小临时空间大小;
  • 在最小临时空间-最大临时空间范围内,随着临时空间增大,Kernel侧接口计算性能会有一定程度的优化提升。为了达到更好的性能,开发者可以根据实际的内存使用情况进行空间预留/申请。

函数原型

void GetLogicalXorMaxMinTmpSize(const platform_ascendc::PlatformAscendC& ascendcPlatform, const ge::Shape& srcShape, const uint32_t typeSize, const bool isReuseSource, uint32_t& maxValue, uint32_t& minValue)

参数说明

表 1接口参数列表

参数名

输入/输出

功能

ascendcPlatform

输入

输入的平台信息。PlatformAscendC的定义请参见构造及析构函数。

srcShape

输入

输入的shape信息。

typeSize

输入

输入的数据类型大小,单位为字节。比如输入的数据类型为half,此处应传入2。

isReuseSource

输入

该参数预留,传入默认值false即可。

maxValue

输出

LogicalXor接口能完成计算所需的最大临时空间大小,超出该值的空间不会被该接口使用。在最小临时空间-最大临时空间范围内,随着临时空间增大,Kernel侧接口计算性能会有一定程度的优化提升。为了达到更好的性能,开发者可以根据实际的内存使用情况进行空间预留/申请。最大空间大小为0表示计算不需要临时空间。

请注意,maxValue仅作为参考值,有可能大于Unified Buffer剩余空间的大小,该场景下,开发者需要根据Unified Buffer剩余空间的大小来选取合适的临时空间大小。

minValue

输出

LogicalXor接口能完成计算所需最小临时空间大小。为保证功能正确,接口计算时预留/申请的临时空间不能小于该数值。最小空间大小为0表示计算不需要临时空间。

返回值说明

约束说明

调用示例

完整的调用样例请参考更多样例。

// 输入shape信息为1024;算子输入的数据类型为half;不允许修改源操作数 std::vector<int64_t> shape_vec = {1024}; ge::Shape shape(shape_vec); uint32_t maxValue = 0; uint32_t minValue = 0; auto plat = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); AscendC::GetLogicalXorMaxMinTmpSize(plat, shape, 2, false, maxValue, minValue);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/853106/

相关文章:

  • 3分钟掌握Blender四边形重拓扑:QRemeshify终极简单指南
  • LAV Filters终极配置指南:开源媒体解码器的专业级优化方案
  • 在Windows Hyper-V上运行macOS虚拟机的完整指南
  • WordPress建站有什么用 价格实惠WordPress建站服务商推荐 - 麦麦唛
  • SSH 本地端口转发 LocalForward 绑定 127.0.0.1 失败怎么回事?
  • 全域数学公理:基于32维超复数与易经卦爻的宇宙大一统理论
  • applera1n终极指南:免费绕过iOS 15-16激活锁的简单方法
  • 什么是备忘录模式?一文详解
  • 2027中西医结合内科学网课红黑榜:在职医生深度测评 - 医考机构品牌测评专家
  • 2026年不同预算的专业床垫该怎么选?原来有这些门道!
  • 如何在Windows上打造流畅的B站观看体验:BiliBili-UWP完整指南
  • 机械装备制造生产智能化?2026AI方案主流厂商横评详解:2026年工业智能体选型指南
  • 光合仪/光合作用测定仪/便携式光合仪供应商哪家好?精选优质品牌供您选择 - 品牌推荐大师
  • TongWeb应用移植说明
  • 终极指南:如何用PoeCharm中文版打造《流放之路》完美角色构建
  • 终极JPEG图像深度分析指南:如何用JPEGsnoop解锁图像元数据与压缩指纹
  • 猫抓插件完整指南:一站式解决网页资源下载难题
  • 猫抓插件完全指南:三步掌握浏览器资源嗅探神器
  • 基础差考生必看!2027中西医结合内科学网课TOP5深度解析 - 医考机构品牌测评专家
  • CANN/asc-devkit SIMD API量化设置
  • 如何利用Codex智能解析复杂命令:终极指南与实用技巧
  • Cursor设备标识重置技术:3分钟解决试用限制的完整方案
  • 超以太网联盟挑战英伟达:AI算力网络开放标准之战
  • 全域数学公理:基于32维超复数与易经卦爻的宇宙大一统理论(整理版)
  • 深圳爱格板材全屋定制怎么选?2026 权威实测榜单出炉 - 兔兔不是荼荼
  • 2026年大厂Java面试高频场景题 + 八股文(万字干货,纯手工硬核整理)
  • 蓝图玩家的福音:不用写代码,用UE5.2.1把Windows和安卓包都打出来(附完整配置清单)
  • 2026年5月广州纸板/纸箱/PP聚丙烯中空箱/包装袋/缠绕膜/封箱胶厂家哪家好,认准东莞市复星纸品有限公司 - 2026年企业推荐榜
  • Lusca部署指南:生产环境中的最佳安全实践
  • OpenArm开源机械臂终极指南:从零开始构建你的7自由度人形手臂