当前位置: 首页 > news >正文

CANN/DeepSeek-V3.2-Exp配置说明

YAML Parameter Description

【免费下载链接】cann-recipes-infer本项目针对LLM与多模态模型推理业务中的典型模型、加速算法,提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-infer

The configuration instructions in the YAML file can be found below.

Basic Config model_name: "deepseek_v3.2_exp" # The model name. String type model_path: "/data/models/DeepSeek-V3.2-Exp-bf16/" # The model path. String type exe_mode: "ge_graph" # The execution mode. Only support ["ge_graph", "eager", "acl_graph"] world_size: 128 # The world size. Int type Model Config pa_block_size: 128 # PA Block Size value. Support [128, 256] enable_weight_nz: True # Whether use nz-weight format for better performance. Support [False, True] with_ckpt: True # Whether load ckpt. Support [False, True] enable_multi_streams: True # Whether enable multistream for better performance. Support [False, True] enable_profiler: True # Whether enable profiling. Support [False, True] enable_cache_compile: False # Whether enable cache compile for better performance. Support [False, True] prefill_mini_batch_size: 0 # Mini_batch_size for prefill stage. perfect_eplb: False # Whether enable, test uniform scenario of MoE experts. Support [False, True] enable_auto_split_weight: True # Whether enable auto-split weight. Support [False, True] next_n: 1 # Steps using multi-token prediction. Support [0, 1, 2, 3] enable_offload: False # Whether enable offload. Support [False, True] Data Config dataset: "default" # Support ["default" "InfiniteBench" "LongBench"] input_max_len: 8192 # The input max length max_new_tokens: 100 # Max new tokens batch_size: 128 # Global batch size Parallel Config cp_size: 128 # Context Parallel Number. When using CP, cp_size should be the same as world_size; otherwise, set cp_size to 1. Only active at prefill stage attn_tp_size: 1 # Attention TP Number oproj_tp_size: 8 # Oproj TP Number. Only support when attn_tp_size == 1 dense_tp_size: 1 # Dense MLP TP Number moe_tp_size: 1 # MoE TP Number embed_tp_size: 16 # Embed TP Number lmhead_tp_size: 16 # LMHead TP Number

【免费下载链接】cann-recipes-infer本项目针对LLM与多模态模型推理业务中的典型模型、加速算法,提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-infer

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/783829/

相关文章:

  • 基于Better Auth的全栈SaaS UI组件库:快速构建认证与支付系统
  • Android多模型AI聊天聚合器:基于Jetpack Compose的隐私优先应用开发实践
  • 基于Python的Claude Telegram Bot服务端:架构设计与部署实战
  • DS4Windows终极指南:5个步骤让PS4手柄在Windows上完美重生
  • 全国手板加工与CNC手板制造,珠三角“一站式”服务商成企业首选 - 深度智识库
  • 基于LLM与向量数据库的智能消息代理系统设计与实现
  • 如何用智能游戏助手彻底告别重复操作:鸣潮自动化工具终极指南
  • 2026年广东二手PCB设备买卖全攻略:从翻新陷阱到整厂搬迁一站式解决方案 - 年度推荐企业名录
  • 微服务架构演进:从单体到分布式,架构师十年实战经验分享
  • GT收发器64B66B协议避坑指南:搞懂Gearbox和Block Sync,告别数据对齐失败
  • 为AI编码助手注入Vue与Nuxt最佳实践:提升开发效率与代码质量
  • 青少年AI夏令营实践:拆掉AI神秘围墙的三天探索之旅
  • 别再踩坑了!Java中BigDecimal用字符串初始化的3个真实场景和1个血泪教训
  • AlphaRank与DCR融合:破解亿级数据排序与探索利用难题
  • 半导体行业展会推荐汇总,中国半导体展优选,助力企业洞察行业前沿 - 品牌2026
  • CANN/catlass: Block Epilogue Visitor 偏特化
  • LLM 模型图模式改造指南
  • 基于Wechaty与OpenAI API构建智能微信机器人的完整实践指南
  • AGC020D 学习笔记
  • 3步解锁高效工作流:KeymouseGo终极鼠标键盘自动化指南
  • SAP与PLM系统BOM集成实战:如何用ABAP函数CSAP_MAT_BOM_MAINTAIN实现‘增量更新’与ECN管理
  • AI预测癌症药物不良反应:效能评估、技术原理与临床落地挑战
  • 2026年山西精准获客与本地门店引流完全指南:GEO优化、短视频代运营五大服务商深度横评 - 优质企业观察收录
  • 【2026最新】11个免费音乐素材网站推荐|无版权BGM下载,商用可用! - 拾光而行
  • 为Hermes Agent配置自定义Provider并接入Taotoken多模型服务
  • 3步搞定百度网盘提取码:从新手到高手的完整进阶指南
  • 保定奥迪维修保养推荐,专业服务值得关注 - 品牌排行榜
  • CANN/ops-cv双线性抗锯齿上采样反向算子
  • AzurLaneAutoScript深度解析:碧蓝航线自动化脚本的技术架构与实践应用
  • Linux内核编译踩坑记:手把手教你解决-Werror和-Wunused-variable报错(附Makefile修改)