当前位置: 首页 > news >正文

CANN/asc-devkit SetGradOutput卷积反向梯度设置

SetGradOutput

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

  • Ascend 950PR/Ascend 950DT:不支持
  • Atlas A3 训练系列产品/Atlas A3 推理系列产品:支持
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品:支持
  • Atlas 200I/500 A2 推理产品:不支持
  • Atlas 推理系列产品AI Core:不支持
  • Atlas 推理系列产品Vector Core:不支持
  • Atlas 训练系列产品:不支持

功能说明

设置卷积反向计算的输入矩阵GradOutput。

函数原型

__aicore__ inline void SetGradOutput(const AscendC::GlobalTensor<SrcT>& gradOutput)

参数说明

表1接口参数说明

参数名输入/输出描述
gradOutput输入GradOutput矩阵在Global Memory上的首地址。类型为GlobalTensor。SrcT表示GradOutput矩阵的数据类型,当前支持的数据类型为:half、bfloat16_t。

返回值说明

约束说明

调用示例

ConvBackpropApi::Conv3DBackpropInput<weightDxType, inputSizeDxType, gradOutputDxType, gradInputDxType> gradInput_; // 设置GradOutput中GlobalTensor的地址 GlobalTensor<gradOutputType> gradOutputGm_; gradOutputGm_.SetGlobalBuffer((__gm__ gradOutputType*)gradOutput); gradInput_.SetGradOutput(gradOutputGm_);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1120029/

相关文章:

  • Frozen扩展开发指南:如何为Frozen添加自定义数据格式支持
  • 如何快速入门httpcache:5分钟实现Go HTTP客户端缓存
  • ZFS-inplace-rebalancing代码实现原理深度解析
  • 给你的桌面注入灵魂:用DyberPet打造会呼吸的数字伙伴
  • Python依赖注入终极指南:python-inject常见问题解答从入门到精通
  • Heya配置完全指南:从基础设置到高级优化的10个技巧
  • ngxtension 数组与对象工具:简化 Angular 数据处理的核心函数
  • BlueHound与Neo4j深度集成:如何利用图数据库技术可视化攻击路径
  • Autopilot-Notes:高精地图与SLAM技术的融合应用深度解析
  • ReScript genType 在 CI/CD 中的集成:自动化类型生成与验证流程
  • 从零到一:使用MeshApiExamples创建自定义程序化网格编辑器
  • 终极指南:如何用Video2X将模糊视频智能修复到4K高清画质
  • Xous代码贡献指南:从代码审查到发布流程的完整手册
  • httpcache缓存策略详解:Fresh、Stale和Transparent状态管理
  • 如何用WeChatMsg构建个人数据主权:微信聊天记录永久保存与智能分析完整指南
  • Flask-profiler配置详解:从SQLite到MongoDB的存储方案选择
  • httpcache:Go语言中RFC 7234兼容的HTTP缓存传输器完全指南
  • OpenTracing-Python异步编程支持:asyncio、gevent和Tornado集成指南
  • CircularProgressView终极配置指南:15个XML属性详解与实战应用
  • GPT-4 Turbo如何重塑科研教学工作流:128k上下文与多模态协同实践
  • 如何使用gh-markdown-preview实现Markdown文件的实时预览与编辑:GitHub CLI用户的终极指南
  • Windows用户如何免费获得苹果苹方字体体验?3分钟快速安装终极指南
  • 如何实现实时水波效果:MeshApiExamples程序化水网格深度解析
  • Mongood地理位置索引可视化:地图预览功能让空间数据一目了然
  • 3个颠覆性技巧:用Video2X让你的老旧视频重获新生
  • Instatic批量操作API:内容与媒体管理自动化的终极指南
  • Colfer性能优化实践:让你的数据传输速度提升300%的秘诀
  • OpenCV图像边缘检测实战:从梯度算子到Canny算法的完整流程与代码解析
  • 20个CSS片段:打造你的专属Obsidian知识库
  • cookies-next高级技巧:如何避免Next.js应用中的Cookie水合错误