当前位置: 首页 > news >正文

cann/asc-devkit:SetSingleOutputShape接口

SetSingleOutputShape

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

  • Ascend 950PR/Ascend 950DT:不支持
  • Atlas A3 训练系列产品/Atlas A3 推理系列产品:支持
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品:支持
  • Atlas 200I/500 A2 推理产品:不支持
  • Atlas 推理系列产品AI Core:不支持
  • Atlas 推理系列产品Vector Core:不支持
  • Atlas 训练系列产品:不支持

功能说明

设置单核上结果矩阵Output的形状。

Conv3D高阶API目前支持M合轴模式的输出方式。在M合轴模式下,Conv3D API内部将Wout和Hout视为同一轴处理,输出时先沿Wout方向输出,完成一整行Wout输出后,再进行下一行的Wout输出。

图1M合轴模式示意图
![](https://raw.gitcode.com/cann/asc-devkit/raw/4d58be33f1da028b6d716e1e6e7b8d9755ae049c/docs/api/figures/M合轴模式示意图.png "M合轴模式示意图"?utm_source=gitcode_repo_files)

函数原型

__aicore__ inline void SetSingleOutputShape(uint64_t singleCo, uint64_t singleDo, uint64_t singleM)

参数说明

参数名输入/输出描述
singleCo输入单核上Output的C维度大小。
singleDo输入单核上Output的D维度大小。
singleM输入单核上Output的M维度大小,即H维度大小与W维度大小的乘积。

返回值说明

约束说明

本接口当前仅支持设置Output的C维度、D维度和M维度(即H轴、W轴合并后的维度),不支持设置原始Output的大小。

调用示例

conv3dApi.SetSingleOutputShape(singleCoreCout, singleCoreDout, singleCoreM);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1120583/

相关文章:

  • 西工大软院大二数据库课程设计:nwpu-cram电商系统
  • FlipperZeroHondaFirmware工作原理深度解析:433MHz RF信号捕获技术
  • 云存储成本分析:Instatic媒体存储方案比较
  • Orgmode插件配置大全:从主题设置到链接解析器的完整配置指南
  • 终极指南:如何让AI助手智能管理你的Obsidian知识库
  • 如何彻底解决PowerShell 7.5在Windows平台的启动崩溃:5步完整指南
  • RVC变声器完整指南:10分钟训练高质量AI音色模型
  • 3步永久保存微信聊天记录:免费工具让珍贵对话永不丢失
  • Yuzu模拟器终极下载指南:快速获取最适合你的版本
  • ContEx未来展望:路线图分析和功能预测
  • IpaDownloadTool扩展功能:如何自定义第三方下载页面规则
  • p5性能优化:提升图形渲染效率的7个实用技巧
  • 自动驾驶笔记:卡尔曼滤波在车辆状态估计中的5个实战案例
  • 从0到1理解kube-prod-runtime:为什么它是Kubernetes生产环境的终极选择
  • 3个关键配置让洛雪音乐音质飙升200%:全网最全音源探索指南
  • opmsg完美前向保密(PFS)深度解析:如何实现比GPG更安全的加密
  • 高频电磁场仿真在RFIC设计中的关键应用与优化
  • Error Lens状态栏功能:实时监控代码问题的实用技巧
  • RVC变声器实战指南:16个核心技术挑战与解决方案深度解析
  • 5步掌握XUnity.AutoTranslator:突破语言障碍的Unity游戏翻译神器
  • AzaharPlus兼容性测试:哪些3DS游戏能完美运行?实测报告
  • OpenCPU安全最佳实践:保护你的科学计算平台免受威胁
  • autopprof跨平台指南:Windows、macOS、Linux全平台支持
  • CANN/Qwen3-Next算子扩展
  • uarch-bench实战案例:揭秘Zen3架构时钟周期性能优化技巧
  • BepInEx游戏插件框架:5分钟快速安装与终极配置指南
  • 服务器高速互连中的信号完整性分析与设计实践
  • Neural Amp Modeler终极指南:从零开始训练专业级吉他音箱模拟模型
  • Redis哈希冲突解决术:链地址法VS开放寻址法,3个关键对比
  • Optimus社区贡献指南:如何参与这个开源数据编排项目