CANN asc-devkit Select函数
Select
【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit
产品支持情况
功能说明
给定两个源操作数srcReg0和srcReg1,根据mask的比特位值选取元素,得到目的操作数dstReg。选择的规则为:当mask的比特位是1时,从srcReg0中选取对应位置的数,比特位是0时从srcReg1选取对应位置的数。
函数原型
template <typename T = DefaultType, typename U> __simd_callee__ inline void Select(U& dstReg, U& srcReg0, U& srcReg1, MaskReg& mask)参数说明
表 1模板参数说明
Ascend 950PR/Ascend 950DT,支持的数据类型为:bool、uint8_t、int8_t、uint16_t、int16_t、uint32_t、int32_t、half、float、bfloat16_t、uint64_t、int64_t。 | |
表 2参数说明
返回值说明
无
约束说明
无
调用示例
template<typename T> __simd_vf__ inline void SelectVF(__ubuf__ T* dstAddr, __ubuf__ T* src0Addr, __ubuf__ T* src1Addr, uint32_t count, uint32_t oneRepeatSize, uint16_t repeatTimes) { AscendC::Reg::RegTensor<T> srcReg0; AscendC::Reg::RegTensor<T> srcReg1; AscendC::Reg::RegTensor<T> dstReg; AscendC::Reg::MaskReg mask; AscendC::Reg::MaskReg cmpReg; for (uint16_t i = 0; i < repeatTimes; i++) { mask = AscendC::Reg::UpdateMask<T>(count); AscendC::Reg::LoadAlign(srcReg0, src0Addr + i * oneRepeatSize); AscendC::Reg::LoadAlign(srcReg1, src1Addr + i * oneRepeatSize); AscendC::Reg::Compare<T, AscendC::CMPMODE::EQ>(cmpReg, srcReg0, srcReg1, mask); AscendC::Reg::Select(dstReg, srcReg0, srcReg1, cmpReg); AscendC::Reg::StoreAlign(dstAddr + i * oneRepeatSize, dstReg, mask); } }【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
