当前位置: 首页 > news >正文

华为CANN TensorFlow AllGather算子

allgather

【免费下载链接】tensorflowAscend TensorFlow Adapter项目地址: https://gitcode.com/cann/tensorflow

功能说明

集合通信算子AllGather的操作接口,将通信域内所有节点的输入按照rank id重新排序,然后拼接起来,再将结果发送到所有节点的输出。

[!NOTE]说明 针对AllGather操作,每个节点都接收按照rank id重新排序后的数据集合,即每个节点的AllGather输出都是一样的。

函数原型

def allgather(tensor, rank_size, group="hccl_world_group", fusion=0, fusion_id=-1)

参数说明

参数名输入/输出描述
tensor输入TensorFlow的tensor类型。
针对Ascend 950PR/Ascend 950DT,支持数据类型:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64、bfp16。
针对Atlas A3 训练系列产品/Atlas A3 推理系列产品,支持数据类型:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64、bfp16。
针对Atlas A2 训练系列产品/Atlas A2 推理系列产品,支持数据类型:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64、bfp16。
针对Atlas 训练系列产品,支持数据类型:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64。
针对Atlas 300I Duo 推理卡,支持数据类型:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64。
rank_size输入group内device的数量,int类型。
最大值为32768。
group输入String类型,最大长度为128字节,含结束符。
group名称,可以为用户自定义group或者"hccl_world_group"。
fusion输入AllGather算子融合标识,int类型,支持以下取值:

- 0:标识网络编译时,不会对该算子进行融合,即该AllGather算子不和其他AllGather算子融合。
- 2:网络编译时,会对AllGather算子按照相同的fusion_id进行融合,即“fusion_id”相同的AllGather算子之间会进行融合。
fusion_id输入AllGather算子的融合id,int类型。
当“fusion”取值为“2”时,网络编译时对相同fusion_id的AllGather算子进行融合。

返回值

对输入tensor执行完allgather操作之后的结果tensor。

约束说明

调用该接口的rank必须在当前接口入参group定义的范围内,不在此范围内的rank调用该接口会失败。

调用示例

from npu_bridge.hccl import hccl_ops tensor = tf.random_uniform((1, 3), minval=1, maxval=10, dtype=tf.float32) rank_size = 2 result = hccl_ops.allgather(tensor, rank_size)

【免费下载链接】tensorflowAscend TensorFlow Adapter项目地址: https://gitcode.com/cann/tensorflow

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/784992/

相关文章:

  • 深耕津门,点亮城市|博涛广告天津商业服务版图全记录 - 品牌企业推荐师(官方)
  • 民间科学家如何借助 Gemini 3.1 Pro 撰写独立研究资助申请?
  • 大理口碑好的养发馆品牌推荐?黑奥秘头皮头发分开洗,精细化护理更科学 - 美业信息观察
  • mustache.java性能优化秘籍:如何实现每秒4000+模板编译
  • CANN/ATVOSS设备适配器运行接口
  • Flux2-Klein-9B-True-V2详细步骤:supervisorctl管理服务状态全流程
  • OpenVINO? C# API . 全新发布,基于 AI 大模型的全栈重构,全面进化!
  • 2026年想找靠谱家政?这份持证的西安家政机构推荐别错过! - 品牌企业推荐师(官方)
  • 2026年国内专业美业学校排名分析:3家高行业认可度院校深度解读 - 产业观察网
  • iVersion核心功能解析:从版本检测到用户通知的完整流程
  • AI赋能戏剧治疗:Gemini3.1Pro打造智能情景库
  • 人生第一双高跟鞋排行:轻奢舒适款全维度对比 - 奔跑123
  • 不同专业论文AI率为什么差别大:理工文史各学科AIGC检测差异免费应对策略解读
  • 抖音视频下载终极指南:3分钟掌握无水印保存技巧
  • AI如何重塑运筹学:从参数生成到模型优化的全流程革新
  • ESP-WHO完全指南:10分钟快速上手人脸检测与识别框架
  • 潍坊巴盾劳保安全鞋:专业服务,守护工作安全 - 品牌企业推荐师(官方)
  • 2026年4月控制电缆源头厂家推荐,控制电缆/仪表电缆/耐火电缆,控制电缆生产厂家选哪家 - 品牌推荐师
  • Qwen3-4B-Thinking-Gemini-Distill实战教程:基于thinking标签的API开发规范
  • 2026年防爆电磁阀厂家哪家好 聚焦多行业工程适配需求 适配多场景 - 深度智识库
  • 【2026收藏版】小白程序员必看!AI Agent核心架构拆解
  • DCMM认证已成大数据科技企业投标加分核心资质 - 品牌企业推荐师(官方)
  • AI辅助全栈开发:Next.js+FastAPI+Supabase模板与Cursor规则实践
  • CANN/cann-bench UnsortedSegmentSum 算子 API 描述
  • CANN/cannbot-skills UB缓冲区管理指南
  • 2026年全国高压电磁阀厂家哪家强 适配新能源半导体工程 覆盖多场景 - 深度智识库
  • 实测 Taotoken 在多模型切换下的延迟表现与用量透明度
  • 传统认为团队人数越多接单能力越强,编程统计团队规模,接单量,利润数据,小团队接单利润率远超大型团队。
  • 2026年长三角地区美发学校实力排行解析:主流机构核心实力梳理 - 产业观察网
  • 2026论文AI检测工具推荐:教师批量筛查一键甄别 - 品牌种草官