当前位置: 首页 > news >正文

CANN/pyasc MDL配置API文档

asc.language.adv.get_mdl_config

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

asc.language.adv.get_mdl_config(intrinsics_limit: bool | None = False, batch_loop: bool | None = False, do_mte2_preload: int | None = 0, is_vec_nd2_nz: bool | None = False, is_per_tensor: bool | None = False, has_anti_quant_offset: bool | None = False, en_unit_flag: bool | None = False, is_msg_reuse: bool | None = True, enable_ub_reuse: bool | None = True, enable_l1_cache_ub: bool | None = False, enable_mix_dual_master: bool | None = False, enable_kdim_reorder_load: bool | None = False) → MatmulConfig

用于配置MDL模板的参数,获取自定义MDL模板。

对应的Ascend C函数原型

__aicore__ constexpr MatmulConfig GetMDLConfig(const bool intrinsicsLimit = false, const bool batchLoop = false, const uint32_t doMTE2Preload = 0, const bool isVecND2NZ = false, bool isPerTensor = false, bool hasAntiQuantOffset = false, const bool enUnitFlag = false, const bool isMsgReuse = true, const bool enableUBReuse = true, const bool enableL1CacheUB = false, const bool enableMixDualMaster = false, const bool enableKdimReorderLoad = false)

参数说明

  • intrinsics_limit: 用于设置参数intrinsicsCheck。参数取值如下:
    • False:当左矩阵或右矩阵在单核上内轴大于等于65535时,不使能循环执行数据的搬入(默认值)。
    • True:当左矩阵或右矩阵在单核上内轴大于等于65535时,使能循环执行数据的搬入。
  • batchLoop: 用于设置参数isNBatch。参数取值如下:
    • False:不使能多Batch(默认值)。
    • True:使能多Batch。
  • do_mte2_pre_load: 用于设置参数enVecND2NZ。参数取值如下:
    • False:不使能通过vector指令进行ND2NZ(默认值)。
    • True:使能通过vector指令进行ND2NZ。
  • is_vec_nd2_nz: 用于设置参数enVecND2NZ。参数取值如下:
    • False:不使能通过vector指令进行ND2NZ(默认值)。
    • True:使能通过vector指令进行ND2NZ。
  • is_per_tensor: 用于设置参数isPerTensor。参数取值如下:
    • True:per tensor量化。
    • False:per channel量化。
  • has_anti_quant_offset: 用于设置参数hasAntiQuantOffset。
  • en_unit_flag: 用于设置参数enUnitFlag。参数取值如下:
    • False:不使能UnitFlag功能。
    • True:使能UnitFlag功能。
  • is_msg_reuse: 用于设置参数enableReuse。参数取值如下:
    • True:直接传递计算数据,仅限单个值。
    • False:传递GM上存储的数据地址信息。
  • enable_ub_reuse: 用于设置参数enableUBReuse。参数取值如下:
    • True:使能Unified Buffer复用。
    • False:不使能Unified Buffer复用。
  • enable_l1_cache_ub: 用于设置参数enableL1CacheUB。参数取值如下:
    • True:使能L1 Buffer缓存Unified Buffer计算块。
    • False:不使能L1 Buffer缓存Unified Buffer计算块。
  • enable_mix_dual_master: 用于设置参数enableMixDualMaster。
  • enable_kdim_reorder_load: 用于设置参数enableKdimReorderLoad。

返回值说明

MatmulConfig结构体。

调用示例

mm_cfg = asc.adv.get_mdl_config() mm = asc.adv.Matmul(a_type, b_type, c_type, bias_type, mm_cfg) asc.adv.register_matmul(pipe, workspace, mm, tiling) mm.set_tensor_a(gm_a) mm.set_tensor_b(gm_b) mm.set_bias(gm_bias) mm.iterate_all(gm_c)

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/782868/

相关文章:

  • 泰山派3M-RK3576-系统功能-Buildroot-音频功能
  • CANN社区管理仓库
  • 【Vue3 + SVG 饼图组件单一数据类别显示异常问题】
  • CANN/ops-cv光栅化算子文档
  • 泰山派3M-RK3576-镜像烧录-成品镜像烧录
  • 吉林K式板房企业排行:5家合规供应商实测对比 - 奔跑123
  • CANN/pypto反量化函数文档
  • cann/cannbot-skills尾安全约束
  • 11.9k Star!Claude Code PPT 神器:本机一行命令,AI 出真还能编辑!
  • 2026新疆财务凭证纸厂家对比:绿色认证资质如何影响政企采购决策 - 优质企业观察收录
  • 一个人,一台电脑,月入翻倍:她如何用AI重构“旅行路书”?
  • CANN高性能线性代数算子库
  • PathAsst:多模态生成式AI如何重塑病理诊断工作流
  • 通过curl命令诊断大模型API连接与返回问题
  • CANN/ops-solver算子列表
  • CANN/HCOMM内存导入关闭API
  • Hermes Agent 应用场景想象
  • CANN/community PR操作指南
  • CANN/tensorflow 后续版本废弃配置
  • 我在上海滩的奋斗
  • 口碑好的四川别墅电梯哪家专业
  • 笑不活了!兰州全城上门收金,旧金变现不用跑区县,在家躺着数钱! - 金掌柜黄金回收
  • AI时代知识工作转型:从生产到批判性整合的核心能力构建
  • AI赋能材料科学:从局域结构表征到分子相互作用预测的完整实践指南
  • 基于SHAP与XAI的3D打印工艺参数优化:从黑箱预测到可解释洞察
  • CANN/pypto eq运算API文档
  • 吉林钢结构厂家实测排行:资质与性能双维度对比 - 奔跑123
  • 2026年新疆热敏收银纸、票据印刷及办公用纸一站式采购指南 - 优质企业观察收录
  • 为内部知识库问答系统集成Taotoken多模型聚合能力
  • 吉林及周边工程总承包企业综合实力排行盘点 - 奔跑123