当前位置: 首页 > news >正文

CANN/ops-cv双三次上采样梯度算子

UpsampleBicubic2dGrad

【免费下载链接】ops-cv本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-cv

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT×
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品
Atlas 推理系列产品
Atlas 训练系列产品×

功能说明

  • 算子功能:UpsampleBicubic2d的反向传播。如果输入张量的shape为(N, C, H, W),则输出张量的shape为(N, C, inputSize[2], inputSize[3])。

  • 计算公式:对于一个二维插值点$(N, C, h, w)$,插值$gradInput(N, C, h, w)$可以表示为:

    $$ {gradInput(N, C, h, w)}=\sum_{i=0}^{3}\sum_{j=0}^{3}{W(i, j)}*{f(h_i, w_j)} $$

    $$ scaleH =\begin{cases} (inputSize[2]-1) / (outputSize[0]-1) & alignCorners=true \ 1 / scalesH & alignCorners=false&scalesH>0\ inputSize[2] / outputSize[0] & otherwise \end{cases} $$

    $$ scaleW =\begin{cases} (inputSize[3]-1) / (outputSize[1]-1) & alignCorners=true \ 1 / scalesW & alignCorners=false&scalesW>0\ inputSize[3] / outputSize[1] & otherwise \end{cases} $$

    其中:

    • i和j是$W(i, j)$的索引变量。

    • $f(h_i, w_j)$是gradOutput在$(h_i, w_j)$的像素值。

    • $W(i, j)$是双三次抗锯齿插值的权重,定义为:

      $$ W(d) =\begin{cases} (a+2)|d|^3-(a+3)|d|^2+1 & |d|\leq1 \ a|d|^3-5a|d|^2+8a|d|-4a & 1<|d|<2 \ 0 & otherwise \end{cases} $$

      其中:

      • $a=-0.75$
      • $d = |(h, w) - (h_i, w_j)|$

参数说明

参数名输入/输出/属性描述数据类型数据格式
grad_output输入表示反向计算的梯度Tensor,对应公式描述中的`gradOutput`。数据类型与输出`grad_input`的数据类型一致。FLOAT32、FLOAT16、BFLOAT16ND
align_corners可选属性
  • 决定是否对齐角像素点,对应公式中的`alignCorners`。align_corners为true,则输入和输出张量的角像素点会被对齐,否则不对齐。
  • 默认值为false。
BOOL-
scales_h可选属性
  • 表示输出`grad_input`的height维度乘数,对应公式中的`scalesH`。
  • 默认值为0.0。
FLOAT32-
scales_w可选属性
  • 表示输出`grad_input`的width维度乘数,对应公式中的`scalesW`。
  • 默认值为0.0。
FLOAT32-
grad_input输出表示采样后的输出张量,对应公式中的`gradInput`。数据类型与输入`grad_output`的数据类型一致。FLOAT32、FLOAT16、BFLOAT16ND

约束说明

调用说明

调用方式样例代码说明
aclnn接口test_aclnn_upsample_bicubic2d_grad通过aclnnUpsampleBicubic2dBackward接口方式调用UpsampleBicubic2dGrad算子。

【免费下载链接】ops-cv本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-cv

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/782956/

相关文章:

  • CANN ops-math clamp算子
  • CANN/hccl:自定义通信算子 - 点对点通信
  • CANN/GE添加控制输入API
  • 如何通过数据分析功能解锁数据深度洞察?
  • 如何高效使用Mermaid Live Editor:5个提升技术文档质量的专业技巧
  • 从三星泄密事件看企业AI安全:LLM数据风险与社会中心AI框架
  • XHS-Downloader:小红书内容采集与批量处理的专业级解决方案
  • 购买域名多少钱一个?大家一般都在哪个平台购买?
  • CANN/atvoss加法运算符API文档
  • Oracle数据库开发最佳实践:构建高效、可维护的应用程序
  • CANN/pyasc Gatherb数据收集API
  • IEDM 2013深度解析:相变存储器的可靠性挑战与产业转向
  • 别把 SFT 里的 `packing` 当成白捡吞吐的开关:TRL 里 `bfd`、`bfd_split`、`wrapped` 真正卖掉的不是同一种东西
  • 62.RTOS调度原理
  • CANN/AMCT大模型Cast量化
  • CANN/sip信号处理加速库CalOperation
  • CANN/hixl LLM-DataDist数据结构
  • 6G时代零接触式普适AI即服务架构:融合区块链与DRL的自动化AI交付
  • cann/runtime其他接口API文档
  • 顶会论文模块复现与二次创新:二次创新:将 DETR 的查询式检测头蒸馏进 YOLOv11,打造混合式 Anchor-free 头
  • 模型诊断:从冲突集到命中集,构建高效故障定位系统
  • CANN/catlass Gemm/Block类模板概述
  • DeepEP V2 为什么值得做 MoE 的团队现在就关注?真正先拖慢吞吐的,不是专家数,而是 EP 通信还在抢 SM
  • 如何高效实现魔兽争霸3现代化兼容?WarcraftHelper实战指南
  • CANN/driver容器共享配置查询
  • CANN/cannbot-skills 模型审查专家代理
  • GD32中的DMA使用教程
  • HCOMM通信算子NPU环境测试
  • Kemptide (Phosphate Acceptor Peptide);LRRASLG
  • 【算法】小白也能懂 · 第 2 节:数组双指针技巧(快慢指针、左右指针)