当前位置: 首页 > news >正文

CANN/asc-devkit Scatter指令API文档

Scatter

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

x

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

x

Atlas 200I/500 A2 推理产品

x

Atlas 推理系列产品 AI Core

x

Atlas 推理系列产品 Vector Core

x

Atlas 训练系列产品

x

功能说明

给定源操作数的寄存器张量和索引张量,以及结果操作数在UB中的基地址,Scatter指令将源操作数按元素根据索引位置分散到UB中。分散过程如下图所示:

定义原型

template <typename T = DefaultType, typename U = DefaultType, typename S, typename V> __simd_callee__ inline void Scatter(__ubuf__ T* baseAddr, S& srcReg, V& index, MaskReg& mask)

参数说明

表 1模板参数说明

参数名

描述

T

目的操作数和源操作数的数据类型。

U

索引的数据类型。

S

源操作数的RegTensor类型,例如RegTensor<half>,由编译器自动推导,用户不需要填写。

V

索引值的RegTensor类型,例如RegTensor<uint16_t>,由编译器自动推导,用户不需要填写。

表 2函数参数说明

参数名

输入/输出

描述

baseAddr

输出

目的操作数在UB中的基地址。

类型为UB指针。

Ascend 950PR/Ascend 950DT,支持的数据类型详见表3。

srcReg

输入

源操作数。

类型为RegTensor。

Ascend 950PR/Ascend 950DT,支持的数据类型详见表3。

index

输入

srcReg中的每个元素在UB中相对于baseAddr的索引位置。索引值要大于等于0。

类型为RegTensor。

IndexT数据类型需要与目的操作数和源操作数的数据类型T配套使用。类型配套对应表详见约束说明。

Ascend 950PR/Ascend 950DT,支持的数据类型详见表3。

mask

输入

src element操作有效指示,详细说明请参考MaskReg。

约束说明

调用示例

template<typename T, typename U> __simd_vf__ inline void ScatterVF(__ubuf__ T* dstAddr, __ubuf__ T* src0Addr, __ubuf__ U* src1Addr, uint32_t count, uint32_t oneRepeatSize, uint16_t repeatTimes) { AscendC::Reg::RegTensor<T> srcReg0; AscendC::Reg::RegTensor<U> srcReg1; AscendC::Reg::MaskReg mask; for (uint16_t i = 0; i < repeatTimes; i++) { mask = AscendC::Reg::UpdateMask<T>(count); AscendC::Reg::LoadAlign(srcReg0, src0Addr + i * oneRepeatSize); AscendC::Reg::LoadAlign(srcReg1, src1Addr + i * oneRepeatSize); AscendC::Reg::Scatter(dstAddr, srcReg0, srcReg1, mask); } }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/851261/

相关文章:

  • 2026年GEO优化公司排行榜:五大头部公司综合实力深度排名 - 博客万
  • 收藏!2026年小白程序员入局AI大模型应用开发的最佳机会(高薪+风口)
  • 全国2026年热门的吸粮机设备公司推荐:界首市金龙机械设备有限公司 - 安互工业信息
  • 减肥代餐新手怎么选?减肥代餐甄选榜:左旋肉碱 + 柑橘多酚 维持体态紧致 - 博客万
  • 2026年GEO优化公司哪家专业性强?五家头部公司核心技术能力深度解析 - 博客万
  • 2026年全国医用微动力系统手术钻采购指南:从无刷电机到专科定制方案完整解析 - 企业名录优选推荐
  • Markdown-to-image最佳实践清单:21个技巧让你的海报图片更加专业
  • 大润发购物卡回收平台推荐京质回收合规安全变现 - 博客万
  • 河北钢套钢保温钢管厂家实力排行实测盘点 - 奔跑123
  • 亨得利2026正规手表深度养护价格全公开(含百达翡丽/江诗丹顿/爱彼等30+品牌真实报价) - 亨得利腕表维修中心
  • 雨和虹防水维修:济宁绿地国际城阳台漏水维修真实案例|免砸砖根治渗水、瓷砖空鼓问题 - 雨和虹防水维修
  • 2026年全国医用微动力系统与无刷电机选型指南:从手术精度到供应链稳定的完整解决方案 - 企业名录优选推荐
  • 雨和虹防水维修:泰安弘盛现代城阳台漏水维修真实案例|高层阳台渗水、窗台发霉、瓷砖空鼓一站式根治 - 雨和虹防水维修
  • 2026水处理剂厂家评测:膜清洗剂,阻垢剂专用实力品牌深度解析 - 深度智识库
  • CooFuni 酵母精粹水 vs 普通爽肤水,护肤选购避坑指南,补水焕肤选对适配肤质 - 博客万
  • 2026 年5月压缩空气流量计十大口碑品牌深度盘点(涡街 / 热式 / 旋进漩涡流量计全覆盖) - 流量计品牌
  • 2026年杭州留学中介top5测评,未拿到offer退款政策全解析优选指南 - 速递信息
  • CANN/asc-devkit SIMD逻辑或函数
  • 2026年度佛山南海区宠物医院综合实力排行榜TOP5 - 速递信息
  • 2026年医用微动力系统与无刷电机选型指南:全国医院、代理商与生产企业的深度横评 - 企业名录优选推荐
  • 沧州钢套钢保温钢管厂家排行:实测资质与交付能力对比 - 奔跑123
  • 2026重庆除甲醛优质机构推荐榜:重庆除甲醛公司电话|重庆除甲醛价格|重庆新房除甲醛|重庆甲醛检测|重庆办公室除甲醛|选择指南,建议收藏! - 空气捍卫者
  • 告别单调界面:用C#为你的SolidWorks插件打造一套专业的多尺寸图标资源(附图标包)
  • OpenCV特征匹配总出错?试试RANSAC滤除误匹配,提升SIFT/SURF匹配准确率
  • 企业内训丨AI 正在重构软件测试体系,企业该如何把“智能化测试”真正落地?
  • ToolTemperature 温度过低,AI推算缺失自由度20260520
  • 滚齿机品牌怎么选?这份覆盖选型、精度、售后的采购参考请收好 - 品牌推荐大师
  • d3d8to9通关秘籍:让经典Direct3D 8游戏在现代系统满血复活
  • 2026年医用微动力系统与无刷电机采购指南:全国医院、代理商与生产企业的深度选型方案 - 企业名录优选推荐
  • 从CARIS 9到11.4:老用户快速上手指南,重点看Georeference Bathymetry这个新核心