当前位置: 首页 > news >正文

CANN/pyasc获取特殊基础配置API文档

asc.language.adv.get_special_basic_config

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

asc.language.adv.get_special_basic_config(basic_m: int, basic_n: int, basic_k: int, single_core_m: int, single_core_n: int, single_core_k: int, step_m: int, step_n: int, intrinsics_limit: bool | None = False, batch_loop: bool | None = False, bmm_mode: BatchMode | None = BatchMode.BATCH_LESS_THAN_L1) → MatmulConfig

用于配置SpecialBasicBlock模板的参数,获取自定义SpecialBasicBlock模板。当前为预留接口。

对应的Ascend C函数原型

__aicore__ constexpr MatmulConfig GetSpecialBasicConfig(const uint32_t basicM, const uint32_t basicN, const uint32_t basicK, const uint32_t singleCoreM, const uint32_t singleCoreN, const uint32_t singleCoreK, const uint32_t stepM, const uint32_t stepN, const bool intrinsicsLimit = false, const bool batchLoop = false, const BatchMode bmmMode = BatchMode::BATCH_LESS_THAN_L1)

参数说明

  • basic_m: 用于设置参数basicM。与TCubeTiling结构体中的baseM参数含义相同,Matmul计算时base块M轴长度,以元素为单位。
  • basic_n: 用于设置参数basicN。与TCubeTiling结构体中的baseN参数含义相同,Matmul计算时base块N轴长度,以元素为单位。
  • basic_k: 用于设置参数basicK。与TCubeTiling结构体中的baseK参数含义相同,Matmul计算时base块K轴长度,以元素为单位。
  • single_core_m: 用于设置参数singleCoreM。单核内M轴shape大小,以元素为单位。
  • single_core_n: 用于设置参数singleCoreN。单核内N轴shape大小,以元素为单位。
  • single_core_k: 用于设置参数singleCoreK。单核内K轴shape大小,以元素为单位。
  • step_m: 用于设置参数stepM。左矩阵在A1中缓存的bufferM方向上baseM的倍数。
  • step_n: 用于设置参数stepN。右矩阵在B1中缓存的bufferN方向上baseN的倍数。
  • intrinsics_limit: 用于设置参数intrinsicsCheck。 当左矩阵或右矩阵在单核上内轴(即尾轴)大于等于65535(元素个数)时,是否使能循环执行数据从Global Memory到 L1 Buffer的搬入。例如,左矩阵A[M, K],单核上的内轴数据singleCoreK大于65535,配置该参数为true后,API 内部通过循环执行数据的搬入。参数取值如下:
    • False:当左矩阵或右矩阵在单核上内轴大于等于65535时,不使能循环执行数据的搬入(默认值)。
    • True:当左矩阵或右矩阵在单核上内轴大于等于65535时,使能循环执行数据的搬入。
  • batch_loop: 用于设置参数isNBatch。 是否多Batch输入多Batch输出。仅对BatchMatmul有效,使能该参数后,仅支持Norm模板,且需调用IterateNBatch实现多 Batch输入多Batch输出。参数取值如下:
    • False:不使能多Batch(默认值)。
    • True:使能多Batch。
  • bmm_mode: 用于设置参数batchMode。 BatchMatmul场景中Layout类型为NORMAL时,设置BatchMatmul输入A/B矩阵的多batch数据总和与L1 Buffer的大小关系。 参数取值如下:
    • batchMode::BATCH_LESS_THAN_L1:多batch数据总和<L1 Buffer Size。
    • batchMode::BATCH_LARGE_THAN_L1:多batch数据总和>L1 Buffer Size。
    • batchMode::SINGLE_LARGE_THAN_L1:单batch数据总和>L1 Buffer Size。

返回值说明

MatmulConfig结构体。

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/784628/

相关文章:

  • Claude Code 用户如何通过 Taotoken 解决访问不稳定与额度焦虑
  • 10个Python一行代码实现高效特征选择
  • Qwen3-4B-Thinking-GGUF惊艳效果:Chainlit中实时流式输出+思维链分步高亮展示
  • torchtitan-npu模型自定义框架
  • 当特征有‘团伙’关系时怎么办?用Python的glmnet实现组套索(Group Lasso)进行基因数据分析
  • 生成式AI社会风险评估:从技术原理到治理框架的实践指南
  • 2026年湖南数控机床设计与非标机床外协全链条服务深度指南 - 年度推荐企业名录
  • CANN/pto-isa GEMM示例
  • ARM中断线桥(IWB)架构与中断处理机制详解
  • CANN/cann-bench: ForeachNorm算子
  • NetBox硬件代理:自动化数据中心资产发现与同步实践
  • 2026全场景整合营销广告公司推荐:包揽品牌升级、整合传播! - 品牌种草官
  • LFM2.5-1.2B-Instruct效果展示:金融交易流水异常模式识别问答效果
  • Hotkey Detective:Windows热键冲突排查实用指南
  • 在 Taotoken 模型广场中根据任务与预算选择合适的模型
  • 用ChatGPT生成IRT数据:当大语言模型遇见心理测量学
  • Driver Store Explorer:释放Windows系统盘空间的终极解决方案
  • 从73.7到89.5,HALO 智能体用“轨迹分析“实现了递归自我进化
  • dirsearch 命令行选项详解:基于官方教程
  • CANN/torchtitan-npu版本策略
  • AGI+IoT融合:边缘智能体的关键技术挑战与实践路径
  • CANN/catlass FlashAttention推理
  • 2026人工草坪企业选型指南,采购不踩坑 - 深度智识库
  • StarRocks MCP Server实战:AI助手与数据库的无缝对话
  • 全球高价值公开数据源全景指南:从专利到遥感,数据科学家的实战地图
  • FLUX.1-Krea-Extracted-LoRA效果展示:丝绸面料光泽与褶皱物理模拟
  • Illustrator脚本开发入门:从零写一个‘日期+序列’的防伪码生成器
  • 大模型参数规模与性能的非线性关系:从规模迷信到精准设计
  • PostgreSQL中UPSERT操作的并发冲突与数据一致性保障策略
  • CANN社区组织信息配置指南