当前位置: 首页 > news >正文

CANN asc-devkit Select函数

Select

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

x

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

x

Atlas 200I/500 A2 推理产品

x

Atlas 推理系列产品 AI Core

x

Atlas 推理系列产品 Vector Core

x

Atlas 训练系列产品

x

功能说明

给定两个源操作数srcReg0和srcReg1,根据mask的比特位值选取元素,得到目的操作数dstReg。选择的规则为:当mask的比特位是1时,从srcReg0中选取对应位置的数,比特位是0时从srcReg1选取对应位置的数。

函数原型

template <typename T = DefaultType, typename U> __simd_callee__ inline void Select(U& dstReg, U& srcReg0, U& srcReg1, MaskReg& mask)

参数说明

表 1模板参数说明

参数名

描述

T

操作数数据类型。

Ascend 950PR/Ascend 950DT,支持的数据类型为:bool、uint8_t、int8_t、uint16_t、int16_t、uint32_t、int32_t、half、float、bfloat16_t、uint64_t、int64_t。

U

源操作数和目的操作数的RegTensor类型, 例如RegTensor<half>,由编译器自动推导,用户不需要填写。

表 2参数说明

参数名

输入/输出

描述

dstReg

输出

目的操作数。

类型为RegTensor。

srcReg0、srcReg1

输入

源操作数。

类型为RegTensor。

两个源操作数的数据类型需要与目的操作数保持一致。

mask

输入

指定选择源操作数的规则:mask的比特位是1时,选取srcReg0,比特位是0时,选取srcReg1。

返回值说明

约束说明

调用示例

template<typename T> __simd_vf__ inline void SelectVF(__ubuf__ T* dstAddr, __ubuf__ T* src0Addr, __ubuf__ T* src1Addr, uint32_t count, uint32_t oneRepeatSize, uint16_t repeatTimes) { AscendC::Reg::RegTensor<T> srcReg0; AscendC::Reg::RegTensor<T> srcReg1; AscendC::Reg::RegTensor<T> dstReg; AscendC::Reg::MaskReg mask; AscendC::Reg::MaskReg cmpReg; for (uint16_t i = 0; i < repeatTimes; i++) { mask = AscendC::Reg::UpdateMask<T>(count); AscendC::Reg::LoadAlign(srcReg0, src0Addr + i * oneRepeatSize); AscendC::Reg::LoadAlign(srcReg1, src1Addr + i * oneRepeatSize); AscendC::Reg::Compare<T, AscendC::CMPMODE::EQ>(cmpReg, srcReg0, srcReg1, mask); AscendC::Reg::Select(dstReg, srcReg0, srcReg1, cmpReg); AscendC::Reg::StoreAlign(dstAddr + i * oneRepeatSize, dstReg, mask); } }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/851487/

相关文章:

  • 深入TI毫米波雷达数据流:从ADC采样到点云输出的代码级解析(以IWR6843AOP Out of Box Demo为例)
  • 从科学视角,如何理解和研究涌现——寻规律,探法则,溯本源|郑志刚
  • m4s-converter完整指南:快速将B站缓存视频转换为MP4格式
  • 采购必备的30+常用术语大全
  • 告别Midjourney订阅费?试试这款免费开源的Fooocus,本地部署就能玩转AI绘画
  • 保姆级教程:用Python和ROS控制越疆Dobot机械臂完成第一个抓取任务(附完整代码)
  • 从零打造可落地的直流电机 PID 驱动系统 (二):增加蓝牙远程控制功能
  • CANN/asc-devkit指数函数API文档
  • MIT Cheetah-Software编译手记:搞定Qt5.10.0路径、LCM依赖与那些诡异的C++报错
  • 两百元预算玩转OpenHarmony标准系统:低成本开发板硬件选型与驱动开发实战
  • 如何用BilibiliDown轻松下载B站视频:新手完整指南
  • Layerdivider深度解析:5步实现智能图像分层,生成专业级PSD文件
  • 2026年成都清水建筑模板批发新趋势,厂家直供更省心 - GrowthUME
  • 2026年B站游戏业务:稳住盈利,两手抓战略寻增量!
  • 从滑动变阻器到真实传感器:STM32CubeMX ADC单通道采集电压的校准与数据处理实战
  • 5分钟告别桌面混乱:免费开源工具NoFences帮你打造高效工作空间
  • 【亲测免费】 开源之旅:ChatGPT-Next-Web,跨平台的智能对话界面
  • 别再只用来测网速了!手把手教你用Win11自带的IIS,5分钟搭个能分享文件的局域网小网站
  • NLP-Models-Tensorflow核心算法详解:从Bahdanau到Luong Attention的演进
  • 2026年建筑模板加工厂精选指南:品质与服务并重的选择 - GrowthUME
  • C++-练习-109
  • 深入解析浏览器端音频解密的5大核心技术:WebAssembly性能优化与安全架构
  • 告别手动调参!用Python脚本批量运行DSSAT模型,5分钟搞定上百个农田情景模拟
  • FreeRDP 终极指南:如何构建跨平台远程桌面解决方案
  • 2026年杭州抗变形建筑模板批发厂家有何独特优势? - GrowthUME
  • setup-java高级配置指南:如何自定义Java架构、包类型和本地安装
  • LFSR不止能生成随机数:盘点数字IC设计中那些意想不到的妙用(从PRBS测试到BIST设计)
  • 从芯片手册到CubeMX:手把手教你搞定STM32G431RBT6的时钟树与中断配置
  • 2026年自建房新趋势:支模木方如何引领绿色建筑革命 - GrowthUME
  • Newbie-Guideline数据库实战:SQL查询与ER模型设计的完整教程