当前位置: 首页 > news >正文

CANN/ops-cv:上采样最近邻3D梯度算子

UpsampleNearest3dGrad

【免费下载链接】ops-cv本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-cv

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品×
Atlas 推理系列产品×
Atlas 训练系列产品×

功能说明

  • 算子功能:UpsampleNearest3d的反向计算。

  • 计算公式:

    $$ gradInput(N, C, D, H, W) += gradOutput( N, C, ceil ( scales_d * D ), ceil ( scales_h * H ), ceil ( scales_w * W )) $$

参数说明

参数名输入/输出/属性描述数据类型数据格式
grad_output输入表示反向计算的梯度Tensor,对应公式中的`gradOutput`。FLOAT32、FLOAT16、BFLOAT16NCDHW
input_size属性表示输出`grad_input`分别在N、C、D、H和W维度上的空间大小。包含5个元素:[min_batch, channels, depth, height, width]。必须满足:input_size[0] == grad_output_tensor_size[0];input_size[1] == grad_output_tensor_size[1]。LISTINT-
output_size可选属性
  • 表示输入`grad_output`在D、H和W维度上的空间大小。size为3,且各元素均大于零。 包含3个元素:[depth, height, width]。只能指定'scales'和'output_size'中的一个。必须满足:grad_output_tensor_size[2] == floor(input_size[2] * scales[0]) == output_size[0];grad_output_tensor_size[3] == floor(input_size[3] * scales[1]) == output_size[1];grad_output_tensor_size[4] == floor(input_size[4] * scales[2]) == output_size[2]。
  • 默认为空。
LISTINT-
scales可选属性
  • 指定沿每个维度的缩放数组,包含3个元素:scale_depth, scale_height, scale_width。对应公式中的`scales_d`、`scales_h`、`scales_w`。
  • 默认为空。
FLOAT32-
y输出表示反向计算的输出张量,对应公式中的`gradInput`。数据类型和数据格式与入参`grad_output`的数据类型和数据格式保持一致。shape取决于输入`input_size`。FLOAT32、FLOAT16、BFLOAT16NCDHW

约束说明

调用说明

调用方式样例代码说明
aclnn接口test_aclnn_upsample_nearest3d_grad通过aclnnUpsampleNearest3dBackward接口方式调用UpsampleNearest3dGrad算子。
图模式-通过算子IR构图方式调用UpsampleNearest3dGrad算子。

【免费下载链接】ops-cv本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-cv

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/788169/

相关文章:

  • 2025届学术党必备的AI科研方案实际效果
  • 2026年太原做阳光房哪家靠谱且不渗漏隔音好? - mypinpai
  • StreamingProactivity技术:实时视频理解与主动交互实践
  • K-12人工智能教育框架:达格斯特三角模型下的技术、社会与用户实践
  • 5步快速掌握:Unlock Music Electron音乐解锁工具终极指南
  • Flutter for OpenHarmony 技术博客阅读器APP
  • 如何深度解析NVIDIA Profile Inspector:解锁显卡隐藏性能的完全指南
  • TVA重塑智慧城市安防新范式(6)
  • 2026年宝马马勒空调压缩机汽车维修哪家靠谱 - mypinpai
  • FPGA实现免外部存储MPEG2视频编码:原理、部署与优化实践
  • 3步完成B站视频转文字:Bili2text的效率革命
  • 跨境物流避坑,怎么选靠谱的运输公司? - 品牌排行榜
  • CANN/ops-rand编译参数说明
  • ComfyUI全面掌握-入门启蒙章节导览|从零搭建 ComfyUI 学习框架——目标、内容与路线
  • 2026年奔驰空调压缩机汽车维修费用解析 - mypinpai
  • ARM架构HSTR_EL2寄存器原理与虚拟化应用
  • 知识竞赛计分如何确保绝对准确?双机热备方案详解与实施要点
  • Ailice开源AI智能体框架:IACT架构与本地部署实战指南
  • 知识竞赛防作弊三件套:抢答锁定、随机抽题与实时监控技术详解
  • ComfyUI全面掌握-知识点详解——生成式 AI 工具对比:ComfyUI 的核心优势
  • Snyk IaC规则库解析:构建基础设施即代码安全策略引擎
  • 5分钟深度解锁:ncmdump智能音频转换方案完全指南
  • 土耳其跨境运输合规的服务商解析 - 品牌排行榜
  • Intel Xeon处理器优化视频点播服务的技术解析
  • Cursor云智能体HTTP客户端库:专为Serverless优化的axios封装方案
  • 百度网盘下载限速终结者:3分钟掌握免费高速下载终极方案
  • Go语言实现Llama模型推理引擎:轻量部署与性能调优指南
  • 从10队到50队:知识竞赛软件的高并发场景如何设计?
  • 自建Web监控与自动化工具:从原理到实践,打造私有化信息抓取方案
  • 2026年论文AIGC率超标恐延毕?必备硬核工具与方法助你化险为夷! - 降AI实验室