当前位置: 首页 > news >正文

CANN设备运行时事实

Device and Runtime Facts

【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills

Use this file for device caps, pipe mappings, supportedauto_sync()pairs, and cross-side mutex signatures. Detailed reasoning still lives in the constraint and pattern pages.

Devices

Resourcea2 (b3)a5 (950)
Cube core count2032
L0A64 KB64 KB
L0B64 KB64 KB
L0C128 KB256 KB
UB192 KB per sub-block256 KB
L1512 KB512 KB
Vec sub-blocks per cube core22

Source:easyasc/globvars.py(defaults),easyasc/a5.py(overrides).

Pipe / op mapping (used byauto_sync())

PipeOps
MTE2gm_to_l1_nd2nz,set_constant_to_l1,gm_to_ub_pad
MTE1l1_to_l0
Mmmad
FIXl0c_to_gm_nz2nd,l0c_to_l1,l0c_to_ub
MTE3ub_to_gm_pad,ub_to_l1_nd2nz,ub_to_l1_nz
Vremaining vec ops

Supportedauto_sync()pipe pairs:

  • vec:MTE2 -> V(ubin),V -> MTE3(ubout)
  • cube:MTE2 -> MTE1(l1),MTE1 -> M(l0),M -> FIX(fix)

Important reminders:

  • there is noV -> MTE2pair
  • dup()beforegm_to_ub_padis not auto-ordered
  • l0c_to_l1is a real FIX-side republish path, not just a codegen detail
  • practical consequence: when one matmul'sL0Cresult feeds a later cube-side matmul, and the intermediate value does not need vec-side UB math first, prefer directL0C -> L1reuse over detouring throughUB

Detail:agent/references/constraints/autosync.md.

Cross-side mutex patterns

  • a5 cube -> vec:CvMutex(src_end_pipe=Pipe.FIX, dst_end_pipe=Pipe.V)
  • a2 cube -> vec:CvMutex(src_end_pipe=Pipe.FIX, dst_end_pipe=Pipe.MTE2); requires GM workspace bridge
  • a5 vec -> cube:VcMutex(src_end_pipe=Pipe.MTE3, dst_end_pipe=Pipe.FIX)
  • a2 vec -> cube: sameVcMutexsignature, but the path still goes through GM workspace

Pattern references:

  • a2 cube -> vec bridge:agent/references/patterns/a2-cube-vec.md
  • a2 vec -> cube bridge:agent/references/patterns/a2-cube-vec-cube.md

【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/782900/

相关文章:

  • 泰山派3M-RK3576-Ai应用-YOLO11-分割模型
  • CANN融合因果一维卷积算子
  • 华为通信/CANN hcomm查询拓扑信息
  • CANN/hcomm通信操作API文档
  • Graph-autofusion super_kernel极简示例
  • 如何快速掌握大气层系统:从新手到专家的终极指南
  • 构建基于Python与机器学习的智能客服
  • 如何高效准确实现表面测温
  • AFSIM 5.3.1在Visual Studio 2015下的详细配置步骤
  • CANN/SHMEM快速使用指南
  • 企业内如何通过Taotoken实现AI模型调用的统一审计与风控
  • ECU-TEST 测试报告自动上传(含代码实现)
  • CANN/ge C++ ES API兼容性设计
  • 可解释AI(XAI)实践指南:从模型透明到业务可信
  • 网盘直链下载助手:九大主流网盘免登录高速下载解决方案
  • 离海数百公里,他们为孩子造了一片“海”
  • 长期使用Taotoken服务在API延迟与稳定性方面的实际感受分享
  • cann/cannbot-skills Kernel定义内存分配
  • CANN/ops-cv NMS掩码算子
  • AI应用上线前必做的5项安全验证:基于SITS2026标准的CI/CD嵌入式检测清单
  • 2026年北京全屋高端定制现代简约风格公司测评与选型指南
  • 泰山派3M-RK3576-系统开发与编译-Buildroot系统-编译内核
  • CANN运行时资源限制内核加载示例
  • Switch游戏文件管理神器:NSC_BUILDER让你告别格式混乱烦恼
  • test000009913
  • 对比多个模型 API 供应商后我为何选择 Taotoken 作为主用平台
  • 模型诊断与知识库调试:从冲突集到高效算法的工程实践
  • 网上祭祀平台哪个更便捷
  • Arm DynamIQ架构性能监控单元(PMU)设计与实战
  • N_m3u8DL-RE终极指南:三步搞定加密流媒体下载,永久保存你喜爱的视频内容