当前位置: 首页 > news >正文

CANN/asc-devkit 设置梯度输出类型

SetGradOutputType

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

功能说明

设置GradOutput的位置、数据格式、数据类型信息,这些信息必须与Kernel侧的设置保持一致。

函数原型

void SetGradOutputType(ConvCommonApi::TPosition pos, ConvCommonApi::ConvFormat format, ConvCommonApi::ConvDtype dtype)

参数说明

表 1参数说明

参数名

输入/输出

描述

pos

输入

GradOutput在内存上的位置。当前仅支持TPosition::GM。

format

输入

GradOutput的数据格式。当前仅支持ConvFormat::NDC1HWC0。

dtype

输入

GradOutput的数据类型。当前仅支持ConvDtype::FLOAT16、ConvDtype::BF16。

返回值说明

约束说明

调用示例

auto ascendcPlatform = platform_ascendc::PlatformAscendCManager::GetInstance(); ConvBackpropApi::Conv3DBpInputTiling conv3DBpDxTiling(*ascendcPlatform); conv3DBpDxTiling.SetGradOutputType(ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::NDC1HWC0, ConvCommonApi::ConvDtype::FLOAT16);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/849348/

相关文章:

  • CANNBot torch-compile 快速入门
  • 2026河北钢制防火门多少钱一平米?甲乙丙级最新报价
  • CANN混元视频配置说明
  • 数据中心工频UPS哪家好?2026工频不间断电源/核磁用UPS电源生产厂家权威推荐 - 栗子测评
  • CTF中的音频隐写术实战:从‘兔耳’和‘调频收音机’两道Misc题,学会用Python脚本提取隐藏信息
  • HermesAgent工具连接Taotoken自定义模型提供方的完整流程
  • CANN Bench交叉熵损失算子评测
  • Matlab阶跃响应性能指标自动化计算:从原理到工程实践
  • 如何快速上手elec-ops-inspection:昇腾平台部署指南
  • Configor 自动重载功能深度解析:实现配置热更新的终极指南
  • CANN/hccl RDMA QP端口配置路径
  • 轨距调整片定制哪家好?2026年绝缘轨距块生产厂家优质供应商推荐指南:新建铁路配件领衔 - 栗子测评
  • 2026机房不间断电源生产厂家哪家好?深圳不间断电源生产厂家实力深度解析 - 栗子测评
  • cann/asc-devkit SetGradOutput接口
  • CANN ops-fft部署指南:生产环境中的配置、监控与故障排除
  • npc_gzip异常处理与调试手册:解决压缩器错误的10个实用技巧
  • Commit Mono版本管理指南:如何优雅地升级和回滚字体版本
  • 源头工厂直供:利成充气水池定制厂家,广东便携式宠物泳池、PVC 戏水玩具、水上充气浮排专业生产基地 - 栗子测评
  • 穿透算法黑箱:2026论文降AI率工具深度测评,早标网语义保真度99%
  • 橡胶垫板定制厂家推荐:新建铁路配件领衔,2026年口碑好的调高垫板批发厂家/轨道橡胶垫板生产厂家/精调件生产厂家盘点 - 栗子测评
  • Transformer架构解析:自注意力机制与LLM核心技术
  • CrossGeo:首个跨卫星-无人机-地面三重视角的6-DoF 3D重建与定位数据集详解
  • 【YOLO目标检测全栈实战】48 深入TensorRT加速:从28ms到6ms的C++推理实战
  • Seed-VC语音克隆指南:5分钟实现零样本实时语音转换的终极方案
  • ARM SPE Profiling Buffer机制与性能分析实践
  • 地空协同巡检新范式:elec-ops-inspection 3D空间建模技术
  • GIFT应用案例:从Web服务到移动应用的实际部署方案
  • USB/IP Windows:打破物理限制的USB设备网络共享终极方案
  • 钢制平开防火窗|2026价格与工程应用要点
  • STR71X芯片JTAG失效分析与Bootloader恢复指南