CANN/asc-devkit SIMD向量长度获取函数
GetVecLen
【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit
产品支持情况
功能说明
获取RegTensor位宽VL(Vector Length)的大小。
函数原型
__aicore__ inline constexpr uint32_t GetVecLen()参数说明
无
返回值说明
Vector Length的大小,单位为byte。
约束说明
无
调用示例
如下样例通过GetVecLen获取循环迭代次数:
template <typename T> __aicore__ inline void AddCustomImpl(__local_mem__ T *dst, __local_mem__ T *src0, __local_mem__ T *src1, uint32_t calCount) { AscendC::Reg::RegTensor<T> reg0; AscendC::Reg::RegTensor<T> reg1; AscendC::Reg::RegTensor<T> reg2; AscendC::Reg::MaskReg mask; constexpr uint32_t repeatElm = AscendC::GetVecLen() / sizeof(T); uint16_t repeatTime = AscendC::CeilDivision(calCount, repeatElm); for (uint16_t i = 0; i < repeatTime; ++i) { mask = AscendC::Reg::UpdateMask<T>(calCount); AscendC::Reg::LoadAlign(reg0, src0 + i * repeatElm); AscendC::Reg::LoadAlign(reg1, src1 + i * repeatElm); AscendC::Reg::Add(reg2, reg0, reg1, mask); AscendC::Reg::StoreAlign(dst + i * repeatElm, reg2, mask); } }【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
