当前位置: 首页 > news >正文

CANN/Ascend C Conv3D Tiling构造函数

Conv3D Tiling构造函数

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

功能说明

用于创建一个Conv3D单核Tiling对象。

函数原型

  • 带参构造函数,需要传入硬件平台信息,推荐使用这类构造函数来获得更好的兼容性。

    • 使用PlatformAscendC类传入信息

      explicit Conv3dTiling(const platform_ascendc::PlatformAscendC& ascendcPlatform)
    • 使用PlatformInfo传入信息

      当platform_ascendc::PlatformAscendC无法在Tiling运行时获取时,需要用户自己构造PlatformInfo结构体,透传给Conv3dTiling构造函数。

      explicit Conv3dTiling(const PlatformInfo& platform)
  • 基类构造函数

    Conv3dTiling继承自基类Conv3dTilingBase,其构造函数如下:

    explicit Conv3dTilingBase(const platform_ascendc::PlatformAscendC& ascendcPlatform)
    explicit Conv3dTilingBase(const PlatformInfo& platform)

参数说明

表1参数说明

参数名输入/输出描述
ascendcPlatform输入传入硬件平台的信息,PlatformAscendC定义请参见构造及析构函数。
platform输入传入硬件版本以及AI Core中各个硬件单元提供的内存大小。PlatformInfo构造时通过构造及析构函数获取。

PlatformInfo结构定义如下方代码所示,socVersion通过GetSocVersion获取并透传,各类硬件存储空间大小通过GetCoreMemSize获取并透传。
struct PlatformInfo { platform_ascendc::SocVersion socVersion; uint64_t l1Size = 0; uint64_t l0CSize = 0; uint64_t ubSize = 0; uint64_t l0ASize = 0; uint64_t l0BSize = 0; uint64_t btSize = 0; uint64_t fbSize = 0; };

约束说明

调用示例

// 实例化Conv3d Api auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); Conv3dTilingApi::Conv3dTiling conv3dApiTiling(ascendcPlatform); conv3dApiTiling.SetGroups(groups); conv3dApiTiling.SetOrgWeightShape(cout, kd, kh, kw); ... conv3dApiTiling.GetTiling(conv3dCustomTilingData.conv3dApiTilingData);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1120200/

相关文章:

  • MCPJungle与Context7集成教程:获取开源库文档从未如此简单
  • 如何免费高效浏览E-Hentai?Android平台终极神器EhViewer使用指南
  • Juggl:Obsidian终极图视图插件 - 革命性知识图谱可视化工具完全指南
  • svu与CI/CD集成实战:自动化发布流程的终极解决方案
  • 大一数学竞赛备赛终极指南:nwpu-cram题型与技巧全解析
  • jinjava错误处理:调试和修复模板问题的完整指南
  • SENet-Tensorflow实战教程:在CIFAR-10数据集上训练ResNeXt模型
  • BigFunctions贡献指南:如何为开源社区添加新的函数
  • Instatic与AI写作:内容生成与优化工具集成指南
  • GhostDB核心架构揭秘:从LRU缓存到AOF持久化的完整实现
  • 如何快速下载E-Hentai画廊:E-Hentai Downloader完整使用指南
  • CTFshow Web37-40 PHP代码审计:伪协议与命令执行绕过实战
  • 3分钟掌握gInk:Windows上最高效的免费屏幕标注工具完全指南
  • CANN/GE FlowMsg类API参考
  • NVMeFix高级配置:自定义APST参数与PCI ASPM优化教程
  • CANN白盒设计网络搜索
  • Claude Opus 4.6与Sonnet 4.6选型指南:从业务约束出发的模型决策逻辑
  • nwpu-cram人工智能算法:遗传算法与应用完整指南
  • Leela Chess Zero vs 传统象棋引擎:为什么神经网络是未来的趋势
  • CANN/HCCL文档总览
  • InVesalius:革命性3D医学影像重建软件,轻松实现从2D切片到立体模型的完整指南
  • 大模型时代Debug新范式(2024最新实践白皮书):基于372个真实AI项目故障日志的根因分析
  • 如何参与MNIST对抗性攻击挑战:从零开始的完整教程
  • TVA:具身智能的动力引擎与能力底座(13)
  • jqjq错误处理机制:try/catch和错误恢复的实现
  • 九大网盘直链解析工具:免费高速下载完全指南
  • OCR对抗攻击实战:基于水印的身份证识别攻击,成功率超90%(附PyTorch代码)
  • NixOps4状态管理深度解析:从JSON模式到持久化策略
  • 四大主流大模型实战评测:长文本、多模态与中文语义深度对比
  • nwpu-cram计算机组成原理实验:Cache设计完全指南