当前位置: 首页 > news >正文

CANN盘古7B配置说明

YAML Parameter Description

【免费下载链接】cann-recipes-infer本项目针对LLM与多模态模型推理业务中的典型模型、加速算法,提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-infer

The configuration instructions in the YAML file can be found below.

Basic Config model_name: "pangu_7B" # The model name. String type model_path: "/dev/shm/ckpts/openPangu-Embedded-7B" # The model path. String type exe_mode: "acl_graph" # The execution mode. Support ["ge_graph", "eager", "acl_graph"] world_size: 1 # The world size. Int type Model Config mm_quant_mode: A16W16 # Support ["A16W16", "A8W8"] gmm_quant_mode: A16W16 # Support ["A16W16", "A8W8"] with_ckpt: True # Whether load ckpt. Support [False, True] enable_profiler: False # Whether enable profiling. Support [False, True] enable_cache_compile: False # Whether enable cache compile. Support [False, True] enable_weight_nz: False # Whether enable weight NZ format. Support [False, True] enable_online_split_weight: True # Whether enable online split weight. Support [False, True] tokenizer_mode: "default" # Support ["default", "chat"] Data Config dataset: "default" # Support ["default", "LongBench"] input_max_len: 2048 # The input max length max_new_tokens: 256 # The max new tokens batch_size: 1 # The global batch size Parallel Config attn_tp_size: 1 # Attention TP Number moe_tp_size: 1 # MoE TP Number embed_tp_size: 1 # Embed TP Number lmhead_tp_size: 1 # LMHead TP Number

【免费下载链接】cann-recipes-infer本项目针对LLM与多模态模型推理业务中的典型模型、加速算法,提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-infer

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/786387/

相关文章:

  • 一键提取视频PPT:开源智能视频内容自动化提取的革命性工具
  • 平滑滚动技术:从原理到实现,打造丝滑交互体验
  • ARM64缓存维护指令DC CVAC详解与应用
  • 5G R18标准:AI/ML如何重塑空口优化与网络架构
  • 终极Blender插件:快速解决虚幻引擎PSK/PSA格式转换难题
  • 3PEAK思瑞浦 TP2264-TS2R-S TSSOP14 运算放大器
  • 多模态大模型Awesome列表:从资源导航到高效学习与开发实践
  • 保姆级 Kali Linux 安装教程|零基础小白也能看懂,从镜像下载到虚拟机配置全程图文详解,零报错上手
  • py每日spider案例之某五八登录接口逆向(RSA算法 难度中等)
  • CANN Triton GE后端实现
  • CANN/opbase算子定义接口
  • Arch Linux自动化部署与深度定制:从脚本化安装到系统优化实战
  • SpiderDemo第一关
  • AArch64虚拟内存系统地址转换与参数配置详解
  • ViGEmBus驱动实战指南:从内核级模拟到性能调优的完整解决方案
  • Taotoken的用量看板让我们的月度AI支出变得清晰可预测
  • Hitboxer:如何用开源工具解决游戏按键冲突的终极方案
  • 三份假文档如何轻取AI知识库?RAG系统漏洞大揭秘!
  • STM32F103 学习笔记-21-串口通信(第5节)—串口2345代码移植和讲解
  • CANN/ops-rand API 实现状态
  • React聊天机器人组件集成指南:从UI定制到AI后端连接
  • 从特征工程到深度学习:AI视网膜疾病诊断的技术演进与工程实践
  • 脑机接口与LLM融合:EEGChat项目实现脑电信号到文本的意图解码
  • 【C++】stackqueuedequepriority_queue深度剖析
  • Codex Mac 安装报错解决教程(应用程序“Codex“无法打开)
  • 第一行代码--初步学习--UI开发--ListView
  • 自动化立体仓库系统项目施工要点
  • Win系统实现网络转发与端口映射:从 IPEnableRouter 到 RRAS 完整步骤
  • 如何快速掌握Blender插件io_scene_psk_psa:虚幻引擎PSK/PSA格式完整指南
  • 数据泄露已成网络安全新热点!成因、危害、溯源防御全方位深度解析