当前位置: 首页 > news >正文

Atlas 800I A2 vs Atlas 300I Duo:盘古Pro MoE硬件选型终极指南

Atlas 800I A2 vs Atlas 300I Duo:盘古Pro MoE硬件选型终极指南

【免费下载链接】Pangu-Pro-MoE项目地址: https://ai.gitcode.com/hf_mirrors/MindSpore-Lab/Pangu-Pro-MoE

盘古Pro MoE是一款高性能的AI模型,为了充分发挥其性能,选择合适的硬件平台至关重要。本文将对比两款主流昇腾硬件——Atlas 800I A2和Atlas 300I Duo,帮助您为盘古Pro MoE模型做出最佳硬件选型决策。

硬件平台基本要求

盘古Pro MoE推理建议使用1台(8卡)Atlas 800I A2(64G)服务器(基于BF16权重)或使用1台(8卡)Atlas 300I Duo服务器(基于BF16权重)。昇思MindSpore提供了盘古Pro MoE推理可用的Docker容器镜像,供开发者快速体验。

软件配置差异

Atlas 300I Duo特殊配置

使用Atlas 300I Duo推理需要将config.json文件中的torch_dtype配置项由bfloat16改为float16。对应的BF16权重将在模型加载时,自动转换为FP16权重。

推理参数调整

在推理参数设置上,两款硬件也有明显区别:

  • gpu_memory_utilization=0.9,Atlas 300I Duo平台需要修改为0.8
  • max_num_seqs=512,Atlas 300I Duo平台需要修改为128
  • max_model_len=32768,Atlas 300I Duo平台需要修改为16384

镜像拉取与容器启动

Atlas 800I A2镜像拉取

若使用Atlas 800I A2进行推理,则需执行以下 Shell 命令,拉取昇思 MindSpore 盘古Pro MoE Atlas 800I A2推理镜像:

Atlas 300I Duo镜像拉取

若使用Atlas 300I Duo进行推理,则需执行以下 Shell 命令,拉取昇思 MindSpore 盘古Pro MoE Atlas 300I Duo推理镜像:

容器启动命令

以Atlas 800I A2推理为例,执行以下命令,创建并启动容器:

若使用Atlas 300I Duo进行推理,则将上述启动命令中的镜像地址swr.cn-central-221.ovaijisuan.com/mindsporelab/pangu_pro_moe_mindspore-infer:800-A2-20250623替换为swr.cn-central-221.ovaijisuan.com/mindsporelab/pangu_pro_moe_mindspore-infer:300I-Duo-20250623

推理服务启动

Atlas 800I A2服务启动

执行以下shell命令启动Atlas 800I A2推理服务:

Atlas 300I Duo服务启动

若使用Atlas 300I Duo进行推理,则需执行以下shell命令启动推理服务:

性能表现对比

在昇腾Atlas 800I A2平台上部署盘古Pro MoE模型(基于W8A8量化权重),可在时延100ms的约束条件下,实现平均每卡1020token/s的增量吞吐性能。配套代码和镜像计划于7月上旬发布,敬请期待。

Atlas 300I Duo虽然在部分参数上有所限制,但凭借其独特的架构设计,在特定场景下也能展现出优异的性能表现,是预算有限情况下的理想选择。

选型建议

  • 追求极致性能和更大模型支持:选择Atlas 800I A2,支持更高的max_num_seqsmax_model_len,适合处理复杂、长文本任务。
  • 预算有限且任务相对简单:选择Atlas 300I Duo,通过适当调整参数,也能满足大部分推理需求。

无论选择哪款硬件,都需要确保按照官方文档正确配置软件环境和参数,以获得最佳性能。建议在正式部署前,根据实际任务特点进行充分测试和评估。

要开始使用盘古Pro MoE模型,请先克隆仓库:git clone https://gitcode.com/hf_mirrors/MindSpore-Lab/Pangu-Pro-MoE,然后根据所选硬件平台,参考README.md中的详细部署指南进行操作。

【免费下载链接】Pangu-Pro-MoE项目地址: https://ai.gitcode.com/hf_mirrors/MindSpore-Lab/Pangu-Pro-MoE

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/898362/

相关文章:

  • 2026年第二季度无线投屏软件选型榜,有哪些好用不收费的屏幕镜像软件
  • 写论文如何又快又好?师兄推荐这几个AI论文软件
  • 从Voxblox到Fast Planner:聊聊几种ESDF地图构建方案的性能与选择
  • Atlas OS终极指南:5步打造轻量级高性能Windows系统
  • 基于Rust与AI的命令行纠错工具:从原理到工程实践
  • 3步解锁音乐自由:这款开源工具让你告别格式束缚
  • orange pi 驱动ws2812灯带
  • 电赛备赛避坑:OpenMV巡线代码里那些没人告诉你的ROI框设置细节(附实战配置图)
  • 设计模式(类的拓扑结构)(为什么会产生设计模式,以及什么是设计模式)
  • 如何用AI短视频创作工具3分钟完成专业视频制作:Pixelle-Video完全指南
  • chatgpt参考过往聊天有什么作用?——还可以设置自己的说法风格,如专业型——chat登入用国内手机无法登入,说查找不到手机——可以采用microsoft账号登入,如邮箱登入,点赞不错——也可以点击
  • ZE41镁合金薄壁铸件集成计算与制备工艺【附代码】
  • 神经网络压缩新范式:低熵矩阵表示CER/CSER格式详解与工程实践
  • 全能型 AI写作辅助平台排行榜(2026 优选)
  • 告别第三方录屏软件!深度评测Unity官方Recorder插件:在编辑器内直接产出高质量视频素材的完整流程
  • 鸣潮自动化助手:5分钟解放双手,告别重复刷本的终极方案
  • 英港大厂AC群面:不当Leader怎么在小组辩论中拿高分?「蒸汽求职分享」
  • Keil编译器工具链版本归档与多版本管理实践
  • ChromaControl完整指南:如何用免费工具统一管理所有RGB设备灯光
  • 三步极速下载:国家中小学智慧教育平台电子课本解析工具完整指南
  • Fusion 360 3D打印螺纹终极指南:5分钟创建完美打印螺纹
  • Overleaf分栏进阶:用multicols环境制作简历、会议手册等非标准文档
  • 3分钟为Windows换上macOS风格鼠标指针:免费美化你的桌面体验
  • 量子计算多程序编译技术DYNAMO解析与应用
  • GPU加速视频编码架构设计:Hap QuickTime编解码器性能优化实战
  • 离散分数阶混沌映射:构建高安全性图像水印的密钥空间革命
  • 告别第三方软件:利用DDNS与端口映射打造专属远程桌面方案
  • EhViewer终极指南:如何在Android上打造完美的开源漫画阅读体验
  • ncmdumpGUI:三步解锁网易云NCM音乐,实现跨平台自由播放的终极指南
  • OpCore Simplify:黑苹果EFI配置终极自动化工具,让黑苹果安装从未如此简单!