当前位置: 首页 > news >正文

cann/asc-devkit SetGradOutput接口

SetGradOutput

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

x

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

Atlas 200I/500 A2 推理产品

x

Atlas 推理系列产品 AI Core

x

Atlas 推理系列产品 Vector Core

x

Atlas 训练系列产品

x

功能说明

设置卷积反向计算的输入矩阵GradOutput。

函数原型

__aicore__ inline void SetGradOutput(const AscendC::GlobalTensor<SrcT> &gradOutput)

参数说明

表 1接口参数说明

参数名

输入/输出

描述

gradOutput

输入

GradOutput矩阵在Global Memory上的首地址。类型为GlobalTensor。SrcT表示GradOutput矩阵的数据类型,当前支持的数据类型为:half、bfloat16_t。

返回值说明

约束说明

调用示例

ConvBackpropApi::Conv3DBackpropInput<weightDxType, inputSizeDxType, gradOutputDxType, gradInputDxType> gradInput_; // 设置GradOutput中GlobalTensor的地址 GlobalTensor<gradOutputType> gradOutputGm_; gradOutputGm_.SetGlobalBuffer((__gm__ gradOutputType *)gradOutput); gradInput_.SetGradOutput(gradOutputGm_);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/849334/

相关文章:

  • CANN ops-fft部署指南:生产环境中的配置、监控与故障排除
  • npc_gzip异常处理与调试手册:解决压缩器错误的10个实用技巧
  • Commit Mono版本管理指南:如何优雅地升级和回滚字体版本
  • 源头工厂直供:利成充气水池定制厂家,广东便携式宠物泳池、PVC 戏水玩具、水上充气浮排专业生产基地 - 栗子测评
  • 穿透算法黑箱:2026论文降AI率工具深度测评,早标网语义保真度99%
  • 橡胶垫板定制厂家推荐:新建铁路配件领衔,2026年口碑好的调高垫板批发厂家/轨道橡胶垫板生产厂家/精调件生产厂家盘点 - 栗子测评
  • Transformer架构解析:自注意力机制与LLM核心技术
  • CrossGeo:首个跨卫星-无人机-地面三重视角的6-DoF 3D重建与定位数据集详解
  • 【YOLO目标检测全栈实战】48 深入TensorRT加速:从28ms到6ms的C++推理实战
  • Seed-VC语音克隆指南:5分钟实现零样本实时语音转换的终极方案
  • ARM SPE Profiling Buffer机制与性能分析实践
  • 地空协同巡检新范式:elec-ops-inspection 3D空间建模技术
  • GIFT应用案例:从Web服务到移动应用的实际部署方案
  • USB/IP Windows:打破物理限制的USB设备网络共享终极方案
  • 钢制平开防火窗|2026价格与工程应用要点
  • STR71X芯片JTAG失效分析与Bootloader恢复指南
  • Symfony String国际化实战:为什么它比原生PHP字符串函数更强大
  • 如何用Lano Visualizer打造智能音频可视化桌面:从音乐爱好者到专业用户的完整指南
  • 【独家首发】Gemini Pro函数调用(Function Calling)深度解析:7个生产环境踩坑案例+可复用的TypeScript Schema模板
  • 保姆级教程:手把手教你用ROS话题转发搞定CARLA与Autoware的传感器数据对齐
  • Windows 11文件资源管理器标签化神器:终极窗口管理解决方案
  • Egg.js TodoMVC实现:完整CRUD操作与前端交互实战
  • 【YOLO目标检测全栈实战】49 模型服务化:用Triton Inference Server部署YOLOv8全流程实战
  • 2026年PMP培训费用从一千到四千,到底多少钱合理
  • Pixelle-Video全球化架构:智能AI短视频引擎的多语言解决方案
  • 通过 Python 快速开始你的第一个 Taotoken 多模型调用示例
  • Cat-Catch:浏览器资源嗅探的终极解决方案与实用指南
  • 消防工程常用无机布卷帘门参数与造价分析
  • OpCore Simplify:3大智能革命,彻底改变Hackintosh配置体验
  • 告别‘自消’:深入浅出聊聊协方差矩阵重建与对角加载如何拯救你的波束形成器