当前位置: 首页 > news >正文

CANN/catlass GEMV AIV搬运模板

TileCopyGemvAiv

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

代码位置

[TOC]

功能说明

TileCopyGemvAiv为 AIV(AI Vector)芯片提供 GEMV 搬运子组件的聚合模板。数据通路为 GM↔UB↔GM,引用 GEMV 专有的搬运组件。

  • 适用范围:AtlasA2
  • 不直接执行算子,以类型成员方式暴露子组件引用

模板原型

template <class ArchTag, class AType, class XType, class YType, class BiasType = void> struct TileCopyGemvAiv;
模板参数说明
ArchTag架构标签
ATypeA 矩阵类型GemmType<ElementA, RowMajor/ColumnMajor>
XTypeX 向量类型GemmType<ElementX, VectorLayout>
YTypeY 向量类型GemmType<ElementY, VectorLayout>
BiasType偏置类型,默认void

成员类型定义

成员类型对应子组件说明
VecCopyGmToUbGemv::Tile::VecCopyGmToUB向量 X: GM→UB
VecCopyUbToGmGemv::Tile::VecCopyUBToGm向量 Y: UB→GM(可选 atomic add)
MatrixCopyGmToUbGemv::Tile::MatrixCopyGmToUB矩阵 A: GM→UB

调用示例

#include "catlass/gemv/tile/tile_copy.hpp" using namespace Catlass::Gemv::Tile; using ElementA = half; using ElementX = half; using ElementY = half; using AType = Gemm::GemmType<ElementA, layout::RowMajor>; using XType = Gemm::GemmType<ElementX, layout::VectorLayout>; using YType = Gemm::GemmType<ElementY, layout::VectorLayout>; using Copy = TileCopyGemvAiv<Arch::AtlasA2, AType, XType, YType>; // 子组件: // typename Copy::VecCopyGmToUb // typename Copy::VecCopyUbToGm // typename Copy::MatrixCopyGmToUb

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/915387/

相关文章:

  • Kimi LeetCode 2836. 在传球游戏中最大化函数值 Java实现
  • CANN/catlass FP8转FP16反量化Tile操作
  • 从功能到价值:初创公司如何通过“卖结果”构建竞争壁垒
  • 宁波酒店厨房设备回收:江北专业的空调回收公司选哪家 - LYL仔仔
  • 【独家首发】全球首份Claude竞品压力测试报告:在金融合同解析、医疗术语推理、多跳法律检索三大高危场景中,仅2家通过95%准确率阈值
  • 2026年GEO源头厂家公司怎么选?杭州本土技术派深度拆解 - 品牌报告
  • 2026宁夏搬家公司推荐,甄选靠谱搬家服务商打造安心搬迁体验 - 品牌鉴赏师
  • 系统性搜寻未知:构建可观测性驱动的技术问题排查框架
  • XLMRoBERTa微调实战:huangjingwang/roberta-ner-multilingual模型训练全流程
  • Windows右键菜单管理终极指南:如何快速掌握ContextMenuManager
  • VideoGameBunny-V1-4B架构深度解析:BunnyPhi3与SigLIP视觉塔的技术融合
  • CANN/catlass A8W4量化TileCopy组件
  • 从状态机到运行时:聊聊 .NET 11 的 Runtime Async 和老 Async/Await 到底差在哪
  • 如何用ok-ww实现3倍效率提升:鸣潮自动化工具完全指南
  • 2026年珠海黄金回收行业大起底:6家门店横评,设备、报价、流程全拆解,第一名没悬念 - 润富黄金珠宝行
  • 义乌家家旺空调维修:义乌空调移机公司怎么联系 - LYL仔仔
  • 如何高效使用DownKyi:B站视频下载的终极解决方案
  • gte-base与其他嵌入模型对比:为什么选择阿里达摩院的文本嵌入方案
  • 30天打造反臃肿AI演示工具:从减法设计到文件优先的工程实践
  • Linux开发者的救星:用Remmina搞定公司Windows堡垒机远程连接(附文件互传保姆级教程)
  • 照着用就行:2026年闭眼可入的专业降AI率平台 - 降AI小能手
  • 【赵渝强老师】崖山数据库的数据字典
  • PoE Overlay终极指南:3个核心功能解决流放之路玩家最头疼的三大问题
  • AI建站避坑指南:10个高频问题帮你躲开90%的坑
  • 2026 年广州装修公司推荐与行业避坑解析 - 商业新知
  • 2026年大模型API路由网关技术观察:市面五个主流平台的客观横评
  • HuggingFace镜像项目glaive_toolcall_zh:中文工具调用数据集贡献者完全指南
  • 2026年成都公司注销代办手续究竟是怎样的流程? - 企业推荐官
  • ControlNet SDXL未来展望:MindSpore-Lab项目的技术路线图与发展方向
  • 华硕笔记本性能优化解决方案:G-Helper深度配置指南