当前位置: 首页 > news >正文

CANN/pyasc算子编程接口

asc.language.adv.get_special_mdl_config

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

asc.language.adv.get_special_mdl_config(intrinsics_limit: bool | None = False, batch_loop: bool | None = False, do_mte2_pre_load: int | None = 0, is_vec_nd2_nz: bool | None = False, is_per_tensor: bool | None = False, has_anti_quant_offset: bool | None = False) → MatmulConfig

用于配置SpecialMDL模板的参数,获取自定义SpecialMDL模板。

对应的Ascend C函数原型

__aicore__ constexpr MatmulConfig GetSpecialMDLConfig(const bool intrinsicsLimit = false, const bool batchLoop = false, const uint32_t doMTE2Preload = 0, const bool isVecND2NZ = false, bool isPerTensor = false, bool hasAntiQuantOffset = false)

参数说明

  • intrinsics_limit: 用于设置参数intrinsicsCheck。参数取值如下:
    • False:当左矩阵或右矩阵在单核上内轴大于等于65535时,不使能循环执行数据的搬入(默认值)。
    • True:当左矩阵或右矩阵在单核上内轴大于等于65535时,使能循环执行数据的搬入。
  • do_mte2_pre_load: 用于设置参数enVecND2NZ。参数取值如下:
    • False:不使能通过vector指令进行ND2NZ(默认值)。
    • True:使能通过vector指令进行ND2NZ。
  • is_vec_nd2_nz: 用于设置参数enVecND2NZ。参数取值如下:
    • False:不使能通过vector指令进行ND2NZ(默认值)。
    • True:使能通过vector指令进行ND2NZ。
  • batch_loop: 用于设置参数isNBatch。参数取值如下:
    • False:不使能多Batch(默认值)。
    • True:使能多Batch。
  • is_per_tensor: 用于设置参数isPerTensor。参数取值如下:
    • True:per tensor量化。
    • False:per channel量化。
  • has_anti_quant_offset: 用于设置参数hasAntiQuantOffset。

返回值说明

MatmulConfig结构体。

调用示例

mm_cfg = asc.adv.get_special_mdl_config() mm = asc.adv.Matmul(a_type, b_type, c_type, bias_type, mm_cfg) asc.adv.register_matmul(pipe, workspace, mm, tiling) mm.set_tensor_a(gm_a) mm.set_tensor_b(gm_b) mm.set_bias(gm_bias) mm.iterate_all(gm_c)

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/787881/

相关文章:

  • 3PEAK思瑞浦 LM2902A-TS2R-S TSSOP14 运算放大器
  • Meta广告AI代理实战:基于MCP协议构建自动化广告管理工具
  • Animal-AI环境:用强化学习复现动物认知实验,评估AI智能水平
  • 智能代理框架ProxyAI:AI赋能API网关与微服务架构实践
  • 集成学习在药物虚拟筛选中的应用:构建稳健AI预测模型
  • 基于FNN与XAI的微射流速度预测及气泡位置影响机制研究
  • 3PEAK思瑞浦 TPA3672-SO1R SOP8 运算放大器
  • SEO地理优化利器:hreflang与JSON-LD实战指南
  • AI赋能密度泛函理论:量子张量学习与机器学习泛函实践
  • 抖音内容下载终极指南:从零开始构建你的专属素材库
  • 动物森友会存档编辑器NHSE:终极完整指南与实战教程
  • AI驱动蛋白质工程:机器学习与拓扑数据分析的融合实践
  • AI接管运维:工程师秒变甩手掌柜
  • 5分钟掌握qmc-decoder:终极QQ音乐加密格式解密指南
  • 华为CANN通信远端内存API
  • CANN随机数算子库文档
  • Spring Boot 缓存优化:从入门到精通
  • 5G波形技术演进与新型解决方案对比
  • 钉钉机器人 Webhook 方式与 SDK 方式接入哪种更适合 CI/CD 场景?
  • 2026年四川地区钢材采购决策:如何筛选靠谱供应商与盛世钢联建立长期合作 - 四川盛世钢联营销中心
  • Arm安全协处理器寄存器架构与内存重映射技术解析
  • 2026粉末冶金加工厂家推荐:铜基与铁基粉末冶金厂家的工艺特点及应用领域 - 栗子测评
  • 使用HermesAgent工具连接Taotoken为自动化测试脚本添加智能分析步骤
  • 测试工程师年度成长清单:每月一个小目标,年底大变样
  • CANN/opbase:设置动态输出张量地址
  • CANN/ATVC PyTorch调用样例
  • 技术人副业指南:8种低门槛、高天花板的变现方式
  • PyTorch 张量操作优化:内存布局与计算效率
  • 杰理之打开OTA打印以及uboot打印的方法【篇】
  • 基于开源模板快速构建AI编程助手:从智能体原理到实战应用