当前位置: 首页 > news >正文

华为CANN PyPTO分布式共享内存写入API

pypto.distributed.shmem_put

【免费下载链接】pyptoPyPTO(发音: pai p-t-o):Parallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto

产品支持情况

产品是否支持
Atlas A3 推理系列产品
Atlas A2 推理系列产品

功能说明

以 offsets 指定的 shared memory tensor 索引位置为基准,将输入的 Tensor 赋值到 shared memory tensor 的对应区域。

函数原型

shmem_put( src: Tensor, offsets: list[Union[int, SymbolicScalar]], dst: ShmemTensor, dst_pe: Union[int, SymbolicScalar], *, put_op: AtomicType = AtomicType.SET, pred: list[Tensor] = None, ) -> Tensor

参数说明

参数名输入/输出说明
src输入源操作数。
支持的数据类型为:DT_INT32,DT_FP16,DT_FP32,DT_BF16。
不支持空 Tensor;Shape 支持 2 - 4 维;Shape Size 不大于 2147483647(即 INT32_MAX)。
支持的数据格式为 ND。
offsets输入dst 的偏移量。
支持 int 或 SymbolicScalar 类型的列表。
offsets 的维度应与 dst 的维度一致,且每个维度的偏移量值应小于 dst 对应维度的大小。
dst输入目的操作数,一个 shared memory tensor,其形状为与src一致。
dst_pe输入shared memory tensor 所属的 pe。
支持的数据类型为 int 或 SymbolicScalar 类型。
0 <= dst_pe < n_pes。
put_op输入数据传输时应用的原子操作类型。
支持的数据类型为: AtomicType.SET,AtomicType.ADD。
默认为 AtomicType.SET 类型。
pred输入用于控制操作执行的依赖关系张量列表。
对数据类型无要求。
不支持空 Tensor。

返回值说明

返回输出 Tensor:用于表示操作完成的依赖关系。

约束说明

调用示例

TileShape 设置示例

说明:调用该接口前,应通过 set_vec_tile_shapes 设置 TileShape。TileShape 维度应和 src 一致。

  • 示例 1:src 的 shape 为 [m, n],TileShape 设置为 [m1, n1],则 m1,n1 分别用于切分 m,n 轴。

    pypto.set_vec_tile_shapes(4, 8)

接口调用示例

  • 示例 1:先创建一个 shared memory tensor。将输入数据赋值到 pe = 1 的 shared memory tensor 的指定区域,并与该视图原本的数据进行累加操作。

    input_tensor = pypto.tensor([16, 64], pypto.DT_BF16, "input_tensor") shmem_shape = input_tensor.shape shmem_tensor = pypto.distributed.create_shmem_tensor(group_name="tp", n_pes=8, dtype=pypto.DT_FP32, shape=shmem_shape) pypto.set_vec_tile_shapes(16, 64) put_out = pypto.distributed.shmem_put( src=input_tensor , offsets=[0, 0], dst=shmem_tensor, dst_pe=1, put_op=pypto.AtomicType.ADD, )
  • 示例 2:先创建一个 shared memory tensor。将输入数据赋值到 pe = 3 的 shared memory tensor 的指定区域,并覆盖该视图原本的数据。

    input_tensor = pypto.tensor([16, 64], pypto.DT_BF16, "input_tensor") shmem_shape = input_tensor.shape shmem_tensor = pypto.distributed.create_shmem_tensor(group_name="tp", n_pes=8, dtype=pypto.DT_FP32, shape=shmem_shape) pypto.set_vec_tile_shapes(16, 64) put_out = pypto.distributed.shmem_put( src=input_tensor, offsets=[0, 0], dst=shmem_tensor, dst_pe=3, put_op=pypto.AtomicType.SET, )

【免费下载链接】pyptoPyPTO(发音: pai p-t-o):Parallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/784387/

相关文章:

  • 告别繁琐手动操作:AzurLaneAutoScript 智能自动化助手深度解析
  • AI与元宇宙融合:构建港口物流数字孪生与智能决策新范式
  • Spring MVC 底层工作流程+源码分析
  • 办公地址位于珠海的澳门公司注册机构 -珠海凯旋 - 速递信息
  • SAP VF02/VF03屏幕增强实战:在发票抬头添加自定义子屏幕(含BADI_SD_CUST_HEAD完整代码)
  • 01华夏之光永存・开源:黄大年茶思屋榜文解法「22期 1题」 超高密度磁存储技术研究|当期专项完整解法
  • CANN/opbase贡献指南
  • 别再只懂RGB了!从sRGB到Lab,5分钟搞懂设计师和程序员都该知道的色彩空间转换
  • 2026玻璃钢水箱厂家怎么选?口碑好、实力强的品牌权威盘点 - 深度智识库
  • 2026主管护师听谁的课?5位宝藏老师实测,过考考生亲证高效 - 医考机构品牌测评专家
  • 常州汽车线束波纹管定制 vs 标准品:2026年5大源头厂家深度测评 - 企业名录优选推荐
  • CANN/ops-cv源码构建指南
  • YOLOv2真的过时了吗?在树莓派4B上部署YOLOv2-Tiny做实时监控,实测FPS和精度对比
  • 国家知识产权局新规:这些 AI 人工智能专利不能申请!
  • DuckyClaw:基于TuyaOpen C SDK的轻量级AI智能体硬件实现
  • 2026年常州热缩管源头厂家深度横评:从标准品到定制化解决方案的产业升级 - 企业名录优选推荐
  • 2026年贵阳防雷检测与防雷工程完全指南:甲级资质机构深度横评 - 年度推荐企业名录
  • 2026 年 5 月液压传感器十大品牌厂家实力排名,东莞南力高稳适配严苛工况 - 品牌速递
  • 企业捐赠AI开源项目背后的三重激励:社会、经济与技术逻辑
  • 2026年探秘:霞浦口碑美食推荐,究竟哪店铺独占鳌头? - 速递信息
  • 2026年功能性机油选购全攻略:破解烧机油痛点的权威推荐 - 博客湾
  • CANN算子测试挑战赛总决赛提交
  • 2026巴厘岛目的地婚礼星级排名TOP10:佩尼达岛到乌鲁瓦图全境权威测评 - charlieruizvin
  • 2026年贵阳防雷检测与防雷工程:甲级资质权威机构深度横评及官方直达指南 - 年度推荐企业名录
  • 2026年泰州干洗店大起底:权威测评排名全揭秘 - 速递信息
  • AlphaOPT:自我进化的大语言模型优化系统解析
  • 意识研究新范式:从被动观察到主动构建的认知革命
  • #2026最新软化水设备公司推荐!陕西西安甘肃兰州等地靠谱机构榜单 - 十大品牌榜
  • 常州轨道交通阻燃编织网管2026年深度测评:昶力管业等5大厂家对标分析 - 企业名录优选推荐
  • 镜像视界(浙江)科技 数字孪生与视频孪生行业地位及核心优势