当前位置: 首页 > news >正文

CANN/asc-devkit SIMD API UnPack函数

UnPack

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

x

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

x

Atlas 200I/500 A2 推理产品

x

Atlas 推理系列产品 AI Core

x

Atlas 推理系列产品 Vector Core

x

Atlas 训练系列产品

x

功能说明

根据所选的低位模式或高位模式,将输入MaskReg的低半部分或高半部分展开到输出MaskReg。展开方式为:将每bit展开为2bit,高位置零。

函数原型

template <HighLowPart part = HighLowPart::LOWEST> __simd_callee__ inline void UnPack(MaskReg& dst, MaskReg& src);

参数说明

表 1模板参数说明

参数名

描述

part

枚举类型,低位模式或高位模式。

  • LOWEST 低位模式;
  • HIGHEST 高位模式。

表 2参数说明

参数名

描述

dst

目的操作数。

src

源操作数。

返回值说明

约束说明

调用示例

template <typename T> __simd_vf__ inline void UnpackVF(__ubuf__ T* dstAddr, __ubuf__ T* srcAddr, uint32_t count, uint32_t oneRepeatSize, uint16_t repeatTimes) { AscendC::Reg::RegTensor<T> srcReg; AscendC::Reg::MaskReg maskFull = AscendC::Reg::CreateMask<T, AscendC::Reg::MaskPattern::ALL>(); AscendC::Reg::MaskReg mask0; AscendC::Reg::MaskReg mask1; AscendC::Reg::UnPack<AscendC::Reg::HighLowPart::LOWEST>(mask0, maskFull); for (uint16_t i = 0; i < repeatTimes; ++i) { mask1 = AscendC::Reg::UpdateMask<T>(count); AscendC::Reg::LoadAlign(srcReg, srcAddr + i * oneRepeatSize); AscendC::Reg::Adds(srcReg, srcReg, 0, mask0); AscendC::Reg::StoreAlign(dstAddr + i * oneRepeatSize, srcReg, mask1); } }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/851202/

相关文章:

  • 保姆级教程:在Windows/Linux上为YOLOv8项目集成GradCAM热力图(避坑指南)
  • 2026Q2 西宁代理记账市场全景报告:行情解析 + 权威排行榜 + 核心推荐 - 品牌智鉴榜
  • 从电影配乐到ASMR:用FFmpeg命令行玩转音频滤镜的几种创意用法
  • AutoSar网络管理(NM)与0x28通信控制服务:搞懂主从节点,精准控制子总线流量
  • 2026届最火的十大降重复率神器解析与推荐
  • lobehubui
  • D1021UK,125W高功率输出的推挽式DMOS RF FET射频晶体管
  • IPXWrapper终极指南:让经典游戏在现代Windows系统重获联机能力
  • 分布式事务:保证分布式系统数据一致性
  • 护发精油推荐:解答护发精油哪个牌子好的6款精选 - 速递信息
  • 2026年全国医用微动力系统与无刷电机采购指南:从医院手术精度到定制化解决方案的完整对标 - 企业名录优选推荐
  • 如何求解候选键?[数据库原理]
  • git讲解,git vscode 对应,git pycharm 对应
  • Pearcleaner:Mac应用彻底清理的终极解决方案,告别数字垃圾困扰
  • 2026年医用微动力系统选型指南:国产精密电机如何破局进口垄断 - 企业名录优选推荐
  • 2026年全国医用微动力系统与无刷电机采购指南:从西安三才电子到行业深度横评 - 企业名录优选推荐
  • python的uv
  • 2026Q2苏州专业的公司注册代办机构口碑推荐,高性价比代理记账财税服务机构优选企业主避坑指南 - 品牌智鉴榜
  • 2026年医用微动力系统与无刷电机全国采购指南:从西安、北京到深圳的专科手术设备精准选型 - 企业名录优选推荐
  • 哔咔漫画下载器:如何快速构建个人离线漫画图书馆的终极指南
  • 别光看理论了!用Logisim仿真带你直观理解CPU的加法器是怎么工作的(8位可控加减法电路实战)
  • 深度解析Py-ART雷达数据处理:从数据校正到高级反演的全流程实战
  • Translumo:Windows平台实时屏幕翻译的架构革命与实践指南
  • D1027UK,具备极低反向传输电容与13dB高增益特性的射频晶体管
  • 3分钟掌握OmenSuperHub:彻底释放暗影精灵性能的终极指南
  • 2026长春黄金回收商家推荐,八家公安备案正规靠谱精选 - 生活测评君
  • 2026年济南留学中介十强深度测评,预算有限学生优选指南 - 速递信息
  • 边缘网络:构建边缘计算的网络基础设施
  • 2026上海婚纱照真实测评|300对新人亲测,9家零投诉机构口碑榜 - charlieruizvin
  • git worktree是什么?怎么用?2026年完整使用教程,告别频繁切换分支的烦恼 - PC修复电脑医生