当前位置: 首页 > news >正文

CANN/catlass 卷积瓦片拷贝

ConvTileCopy

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

代码位置

[TOC]

功能说明

ConvTileCopy是卷积(Conv)场景的搬运模板集合,结构上与 TileCopy 完全相同,区别仅在于模板参数命名和用途——专门服务于 Convolution 的 Im2Col + GEMM 流程。

BiasType 为必选参数(非默认void),因为 Conv 通常包含 Bias。

引用的 Tile 组件

成员别名引用的底层模板说明
CopyGmToL1ACopyGmToL1<ArchTag, AType>A 矩阵 GM→L1
CopyGmToL1BCopyGmToL1<ArchTag, BType>B 矩阵 GM→L1
CopyL1ToL0ACopyL1ToL0A<ArchTag, L1AType>A 矩阵 L1→L0A
CopyL1ToL0BCopyL1ToL0B<ArchTag, L1BType>B 矩阵 L1→L0B
CopyL0CToGmCopyL0CToGm<ArchTag, ElementAccumulator, CType>L0C→GM
CopyGmToL1BiasCopyGmToL1<ArchTag, ...>Bias GM→L1
CopyL1ToBTCopyL1ToBT<ArchTag, ...>Bias L1→BT

模板原型

template < class ArchTag, // 架构标签 class AType, // A 矩阵 GmType class BType, // B 矩阵 GmType class CType, // C 矩阵 GmType class BiasType // Bias GmType(必选) > struct ConvTileCopy;

调用示例

#include "catlass/gemm/tile/tile_copy.hpp" using namespace Catlass::Gemm; using AType = Gemm::GemmType<half, layout::RowMajor>; using BType = Gemm::GemmType<half, layout::ColumnMajor>; using CType = Gemm::GemmType<half, layout::NDC1HWC0>; using BiasType = Gemm::GemmType<half, layout::VectorLayout>; using TileCopy_ = Tile::ConvTileCopy<Arch::AtlasA2, AType, BType, CType, BiasType>; typename TileCopy_::CopyGmToL1A copyGmToL1A; typename TileCopy_::CopyGmToL1B copyGmToL1B; typename TileCopy_::CopyGmToL1Bias copyGmToL1Bias; typename TileCopy_::CopyL1ToBT copyL1ToBT; typename TileCopy_::CopyL0CToGm copyL0CToGm;

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/917271/

相关文章:

  • Warcraft Helper:让经典魔兽争霸3在现代电脑上完美运行的终极方案
  • D3KeyHelper:如何高效使用暗黑3技能连点器提升游戏体验
  • 2026在线证件照换底色工具推荐:免费工具手把手教程 - AI测评专家
  • 2026年头疗加盟公司深度测评:领军品牌领衔,优劣全解析 - 资讯纵览
  • Pix2Text:开源Python工具,轻松实现图像到Markdown的智能转换
  • AI 编程工具面试题(Claude Code、Codex 等)基础篇(一)
  • Merkle树性能优化与工程实践
  • 终极指南:深度掌握AMD Ryzen SMU调试工具的专业实战技巧
  • MOSS-Video-Preview-Real-Time-SFT代码实现原理:从数据处理到模型推理全流程
  • HLS Downloader:如何在浏览器中安全高效地下载HLS流媒体视频
  • 软床品牌选型技术指南:从产能到品质的硬核拆解 - 奔跑123
  • d2s-editor:暗黑破坏神2存档编辑器的技术实现与创新实践
  • Gemini API网关超时暴增217%?紧急封堵3个被官方文档隐瞒的gRPC Keepalive配置漏洞
  • github仓库合并
  • 3分钟上手BilibiliDown:小白也能轻松下载B站视频的完整指南
  • 2026 全自动金相切割机厂家推荐,高性价比设备生产厂家盘点 - 商业新知
  • 告别依赖烦恼:用linuxdeployqt把QT程序打包成独立AppImage(Ubuntu 20.04实测)
  • CANN/ops-blas文档编写Agent
  • PilotDeck工作区详解:项目级隔离如何提升你的工作效率
  • CANN/catlass L1到L0A数据搬运模块
  • CompressO:当数字生活遇上“空间焦虑“,这款免费神器如何帮你找回存储自由?
  • 【亲测免费】 推荐一个生动有趣的Web交互体验:Live2D看板娘插件
  • 2025-2026年武汉家装市场观察:本土实力企业盘点与业主选企参考 - 商业新知
  • 从.lnk文件头到路径解析:一份给逆向新手的Windows Shell Link格式入门指南
  • 证件照背景更换软件推荐:2026保姆级教程,手把手教你一键换底色(附软件对比) - AI测评专家
  • 2026 国内GEO十大培训机构排行榜,AI搜索排名培训机构推荐 - 莫瑶影视教育
  • LLC设计指南(四)第四章 :终于讲到 LLC 的灵魂——为什么 MOS 能实现 ZVS?
  • 再读人性话题的深度应用与价值重构
  • 【AI工具终极使用指南大全】:仅限内部流传的「AI就绪度评估矩阵」——含12维评分卡+自动诊断脚本
  • vue使用笔记、import、export等