当前位置: 首页 > news >正文

CANN/asc-devkit SIMD矢量解包API

asc_unpack

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

矢量解包操作。对于无符号整型,将源操作数中低半部分或高半部分的元素以高位填0扩充位宽的方式写入目标操作数,对于有符号整型,将源操作数中低半部分或高半部分元素以保持符号位扩展位宽的方式写入目标操作数,对于布尔矢量,将源操作数中低半部分或高半部分的元素,保持其真值并维持原有的顺序,写入目标操作数。

函数原型

__simd_callee__ inline void asc_unpack_upper(vector_uint16_t& dst, vector_uint8_t src) __simd_callee__ inline void asc_unpack_lower(vector_uint16_t& dst, vector_uint8_t src) __simd_callee__ inline void asc_unpack_upper(vector_int16_t& dst, vector_int8_t src) __simd_callee__ inline void asc_unpack_lower(vector_int16_t& dst, vector_int8_t src) __simd_callee__ inline void asc_unpack_upper(vector_uint32_t& dst, vector_uint16_t src) __simd_callee__ inline void asc_unpack_lower(vector_uint32_t& dst, vector_uint16_t src) __simd_callee__ inline void asc_unpack_upper(vector_int32_t& dst, vector_int16_t src) __simd_callee__ inline void asc_unpack_lower(vector_int32_t& dst, vector_int16_t src) __simd_callee__ inline void asc_unpack_upper(vector_bool& dst, vector_bool src) __simd_callee__ inline void asc_unpack_lower(vector_bool& dst, vector_bool src)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器/掩码寄存器)。
src输入源操作数(矢量数据寄存器/掩码寄存器)。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

vector_uint16_t dst; vector_uint8_t src; asc_loadalign(src, src_addr); // src_addr是外部输入的UB内存空间地址。 asc_unpack_upper(dst, src);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1045059/

相关文章:

  • 告别jQuery!轻量级ieBetter.js让IE6-IE8支持querySelector和事件绑定
  • 美格信解读:从公式到听感,THD与THD+N的实战辨析
  • 图片压缩到200KB以内 手机小程序精确压缩方法 - 图片处理研究员
  • 从入门到精通:Catcher异常过滤器与参数排除高级用法终极指南
  • 2026郑州空调维修避坑:高温天气不制冷、漏水、异响故障诊断+维修平台对比 - 一步到家
  • 从密文到明文:手把手解析SecureCRT会话密码恢复
  • Markoff自定义配置:打造个性化Markdown写作环境
  • Xiaomusic深度解析:3大核心功能与进阶配置实战指南
  • 解决Docker Machine文件共享慢问题:NFS替代默认挂载的完整方案
  • Bamboo与ZooKeeper集成:分布式配置管理的完整实践指南
  • Madmom深度解析:Python音乐信息检索的高效方案
  • 淮南GEO服务商代理加盟选型靠谱推荐哪家?2026年淮南GEO优化代理加盟服务商选型指南与合作权益解析 - 子柔传媒
  • MC9S08DE60微控制器12位ADC模块:从原理到实战配置详解
  • 3步突破性实现A股智能分析自动化:从手动复盘到AI驱动的革命性转变
  • Burp Suite专业版从零配置到实战:Web安全测试核心工作流详解
  • 2026合肥防水补漏维修团队实测盘点TOP4:合肥业主房屋渗漏修缮靠谱选择 - 宅安选房屋修缮
  • 2026济南防水补漏维修团队实测盘点TOP4:济南业主房屋渗漏修缮靠谱选择 - 宅安选房屋修缮
  • 2026佛山防水补漏维修团队实测盘点TOP4:佛山业主房屋渗漏修缮靠谱选择 - 宅安选房屋修缮
  • ytcast未来展望:功能路线图与社区贡献指南
  • 如何用WeChatFerry快速搭建智能微信机器人:5分钟搞定AI助手
  • 2026年阜阳GEO服务商代理加盟选型靠谱推荐丨阜阳GEO优化代理合作路径与合伙人收益全解析 - 小随科技
  • 如何快速上手Solana Jupiter Bot:从安装到首次交易的完整教程
  • 2026年 北京丰台区防水堵漏推荐榜单:楼顶/外墙/卫生间/厨房/阳台/地下室/窗台防水施工公司精选! - 品牌发掘
  • QLTools环境变量提交全攻略:从手动操作到半自动流程优化
  • PingFangSC字体解决方案:跨平台中文显示一致性技术实现
  • OmenSuperHub:彻底释放惠普游戏本性能的开源控制工具
  • 纪念币防氧化养护全攻略,养好品相提升藏品成交价 - 深鉴新闻
  • KETTLE日志记录、任务巡检、邮件发送
  • TPA3255 Class D功放实战:从选型到调音的全链路设计指南
  • Extended WPF Toolkit架构深度解析:企业级WPF控件库的完整解决方案