当前位置: 首页 > news >正文

CANN/HCOMM Python样例执行指南

样例执行

【免费下载链接】hcommHCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm

本节以单机8卡组网、通过rank table文件配置资源信息的方式为例,介绍如何运行代码示例中的样例代码。

  1. 准备rank table文件。

    rank table的配置方法可参见集群信息配置,此处以“rank_table.json”命名为例。

  2. 构造启动脚本。

    假设命名为hccl_start_8p.sh,示例如下:

    # 配置CANN软件环境变量(以root用户为例): source /usr/local/Ascend/cann/set_env.sh # TF Adapter python库,其中${TFPLUGIN_INSTALL_PATH}为TF Adapter软件包安装路径。 export PYTHONPATH=${TFPLUGIN_INSTALL_PATH}:$PYTHONPATH export RANK_SIZE=8 export RANK_TABLE_FILE=/home/test/rank_table.json # rank table资源配置文件路径,请根据实际情况替换 export JOB_ID=10087 # 用户自定义,指定任务ID,可以包含大小写字母、数字、中划线或下划线 for((RANK_ID=0;RANK_ID<$((RANK_SIZE));RANK_ID++)); do export RANK_ID=$RANK_ID export ASCEND_DEVICE_ID=$RANK_ID # 执行脚本,脚本路径与名称请根据实际情况替换 nohup python3 /home/test/hccl_test.py & done
  3. 执行启动脚本。

    bash hccl_start_8p.sh

    结果示例如下:

    ... ... 'reduce_sum': array([[ 0, 0, 0, ..., 0, 0, 0], [ 0, 0, 0, ..., 0, 0, 0], [ 0, 0, 0, ..., 0, 0, 0], ..., [ 0, 0, 0, ..., 0, 0, 0], [ 0, 0, 0, ..., 0, 0, 0], [ 0, 0, 0, ..., 44, 44, 44]]), 'reduce_max': array([[4097, 4098, 4099, ..., 4222, 4223, 4224], [4225, 4226, 4227, ..., 4350, 4351, 4352], [4353, 4354, 4355, ..., 4478, 4479, 4480], ..., [4737, 4738, 4739, ..., 4862, 4863, 4864], [4865, 4866, 4867, ..., 4990, 4991, 4992], [4993, 4994, 4995, ..., 9, 9, 9]]), 'reduce_min': array([[0, 0, 0, ..., 0, 0, 0], [0, 0, 0, ..., 0, 0, 0], [0, 0, 0, ..., 0, 0, 0], ..., [0, 0, 0, ..., 0, 0, 0], [0, 0, 0, ..., 0, 0, 0], [0, 0, 0, ..., 2, 2, 2]]), 'reduce_prod': array([[ 0, 0, 0, ..., 0, 0, 0], [ 0, 0, 0, ..., 0, 0, 0], [ 0, 0, 0, ..., 0, 0, 0], ..., [ 0, 0, 0, ..., 0, 0, 0], [ 0, 0, 0, ..., 0, 0, 0], [ 0, 0, 0, ..., 362880, 362880, 362880]]), 'alltoallv_tensor': array([ 1, 2, 3, ..., 8246, 8247, 8248]), 'check_tensors': array([ 1, 2, 3, ..., 8246, 8247, 8248]) train success

【免费下载链接】hcommHCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/783346/

相关文章:

  • 企业生成式AI治理:从风险管控到价值实现的五维框架
  • 边缘AI能耗优化:目标导向DNN分割架构设计与工程实践
  • 1283C 构造
  • 2026年中原区装修公司优选指南 口碑评测+全场景适配老房翻新别墅装修 - 品牌智鉴榜
  • 2025届必备的六大降重复率助手实际效果
  • 低延迟游戏耳机哪个牌子专业? - 中媒介
  • 面向单身群体:靠谱婚恋公司的选择思路 - 深度智识库
  • AI如何将隐性知识转化为可规模化应用:技术栈、实施路径与挑战
  • 运动耳机狂甩不掉推荐哪个品牌? - 中媒介
  • 2026年质量好的不锈钢泵站品牌推荐:不锈钢一体化泵站/不锈钢雨水泵站/不锈钢预制泵站/不锈钢提升泵站厂家选购真相 - 泵站报价15613348888
  • CANN/ge FlowMsg数据类型
  • CANN/ops-cv双三次插值调整算子
  • 戴眼镜友好耳机哪个牌子专业? - 中媒介
  • 泊头市同辉会展服务:东城专业的门头搭建公司有哪些 - LYL仔仔
  • AI那些趣事系列123:目前主流的智能体可观测性和智能体评测相关的产品调研
  • 2026连云港黄金回收哪家靠谱?亲测海州连云赣榆三家实体店-金福楼/金如意/金满意 - 李甜岚
  • 阴阳师百鬼夜行AI自动化脚本完全指南:智能碎片收集终极教程
  • CANN反射填充2D反向传播算子
  • cann/shmem Python API参考文档
  • 源网荷储微电网系统哪家强?知名企业与头部品牌技术实力对比 - 品牌推荐大师
  • 脉冲神经网络:从决策到共情的多层级类脑智能实现
  • 高效内容采集方案:深度解析开源工具的专业应用
  • 2026年贵阳室内装修全案设计深度横评:从设计落地到智能交付的完整避坑指南 - 优质企业观察收录
  • CANN/amct剪枝再训练模型创建
  • Q-learning强化学习在寡头市场定价博弈中的仿真实验与迁移效应分析
  • 个人任务工作(5.7)
  • 宁波甬旭遮阳设备:北仑遮阳棚定制怎么联系 - LYL仔仔
  • 福州旺顺机械设备租赁:福州承接厂房搬迁服务周到的公司 - LYL仔仔
  • UVa 188 Perfect Hash
  • FedAIoT:物联网联邦学习基准框架的设计、实现与评估