当前位置: 首页 > news >正文

CANN/asc-devkit Conv3DBackpropFilter Tiling使用说明

Conv3DBackpropFilter Tiling使用说明

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

Ascend C提供一组Conv3DBackpropFilter Tiling API,方便用户获取Conv3DBackpropFilter Kernel计算时所需的Tiling参数。用户只需要传入Input/GradOutput/GradWeight的Position位置、Format格式和DType数据类型及相关参数等信息,调用API接口,即可获取Init中TConv3DBpFilterTiling结构体中的相关参数。

Conv3DBackpropFilter Tiling API提供一个GetTiling接口获取Tiling参数,获取Tiling参数的流程如下:

  1. 创建一个单核Tiling对象。
  2. 设置Input、GradOutput、GradWeight的参数类型信息以及Shape信息,如果存在Padding、Stride参数,通过SetPadding、SetStride接口设置。
  3. 调用GetTiling接口,获取Tiling信息。

使用Conv3DBackpropFilter Tiling接口获取Tiling参数的样例如下:

#include "tiling/conv_backprop/conv3d_bp_filter_tiling.h" optiling::Conv3DBackpropFilterTilingData tilingData; auto ascendcPlatform = platform_ascendc::PlatformAscendCManager::GetInstance(); ConvBackpropApi::Conv3dBpFilterTiling conv3dBpDwTiling(*ascendcPlatform); conv3dBpDwTiling.SetWeightType( ConvCommonApi::TPosition::CO1, ConvCommonApi::ConvFormat::FRACTAL_Z_3D, ConvCommonApi::ConvDtype::FLOAT32); conv3dBpDwTiling.SetInputType( ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::NDC1HWC0, ConvCommonApi::ConvDtype::FLOAT16); conv3dBpDwTiling.SetGradOutputType( ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::NDC1HWC0, ConvCommonApi::ConvDtype::FLOAT16); conv3dBpDwTiling.SetGradOutputShape(n, c, d, h, w); conv3dBpDwTiling.SetInputShape(n, c, d, h, w); conv3dBpDwTiling.SetWeightShape(cout, cin, d, h, w); conv3dBpDwTiling.SetPadding(padFront, padBack, padUp, padDown, padLeft, padRight); conv3dBpDwTiling.SetStride(strideD, strideH, strideW); conv3dBpDwTiling.SetDilation(dilationD, dilationH, dilationW); int ret = conv3dBpDwTiling.GetTiling(tilingData); // 如果ret = -1,获取tiling结果失败

需要包含的头文件

#include "lib/conv_backprop/conv3d_bp_filter_tiling.h"

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1120217/

相关文章:

  • Laravel Vonage Notification Channel源码解析:短信发送的实现原理与流程
  • CANN/mat-chem-sim-pred FOPDT批量闭环评分API
  • 如何免费下载E-Hentai漫画档案:E-Hentai-Downloader完整使用指南 [特殊字符]
  • Gradle Docker插件版本管理:如何处理镜像标签和版本冲突的完整指南
  • ANSI转义序列实战:从终端色彩到动态界面
  • 如何用VisProg解决四大视觉任务?GQA/NLVR/图像编辑/目标标记实战教程
  • SENet-Tensorflow数据预处理详解:CIFAR-10数据集加载与增强技巧
  • jqjq REPL使用指南:交互式JSON查询与处理的终极技巧
  • 文本嵌入实战指南:TF-IDF、word2vec与BERT选型避坑手册
  • 昇腾AI处理器GlobalTensor形状获取
  • CANN/GE自定义算子开发指南
  • CANN/cannbot-skills:环境快照
  • Obsidian-zola社区指南:如何贡献代码和参与开发
  • AI 图标生成入库:漂亮图标还要过语义和网格检查
  • Packtpub-crawler通知系统详解:邮件、IFTTT、Pushover多平台提醒设置指南
  • CANN/asc-devkit SIMD数据加载API
  • CANN/Ascend C Conv3D Tiling构造函数
  • MCPJungle与Context7集成教程:获取开源库文档从未如此简单
  • 如何免费高效浏览E-Hentai?Android平台终极神器EhViewer使用指南
  • Juggl:Obsidian终极图视图插件 - 革命性知识图谱可视化工具完全指南
  • svu与CI/CD集成实战:自动化发布流程的终极解决方案
  • 大一数学竞赛备赛终极指南:nwpu-cram题型与技巧全解析
  • jinjava错误处理:调试和修复模板问题的完整指南
  • SENet-Tensorflow实战教程:在CIFAR-10数据集上训练ResNeXt模型
  • BigFunctions贡献指南:如何为开源社区添加新的函数
  • Instatic与AI写作:内容生成与优化工具集成指南
  • GhostDB核心架构揭秘:从LRU缓存到AOF持久化的完整实现
  • 如何快速下载E-Hentai画廊:E-Hentai Downloader完整使用指南
  • CTFshow Web37-40 PHP代码审计:伪协议与命令执行绕过实战
  • 3分钟掌握gInk:Windows上最高效的免费屏幕标注工具完全指南