当前位置: 首页 > news >正文

CANN/asc-devkit asc_squeeze向量压缩API文档

asc_squeeze

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

通过比较掩码src1,将src0中的向量压缩成更短的向量,存储到dst中。

函数原型

__aicore__ inline void asc_squeeze(__ubuf__ uint16_t* dst, __ubuf__ uint16_t* src0, __ubuf__ uint16_t* src1, uint8_t repeat, uint8_t dst_block_stride, uint8_t src0_block_stride, uint8_t src1_block_stride, uint8_t dst_repeat_stride, uint8_t src0_repeat_stride, uint8_t src1_repeat_stride) __aicore__ inline void asc_squeeze(__ubuf__ uint32_t* dst, __ubuf__ uint32_t* src0, __ubuf__ uint32_t* src1, uint8_t repeat, uint8_t dst_block_stride, uint8_t src0_block_stride, uint8_t src1_block_stride, uint8_t dst_repeat_stride, uint8_t src0_repeat_stride, uint8_t src1_repeat_stride)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量)的起始地址。
src0、src1输入源操作数(矢量)的起始地址。
count输入参与计算的元素个数。
repeat输入迭代次数。
dst_block_stride输入目的操作数单次迭代内不同DataBlock间地址步长。
src0_block_stride输入源操作数0单次迭代内不同DataBlock间地址步长。
src1_block_stride输入源操作数1单次迭代内不同DataBlock间地址步长。
dst_repeat_stride输入目的操作数相邻迭代间相同DataBlock的地址步长。
src0_repeat_stride输入源操作数0相邻迭代间相同DataBlock的地址步长。
src1_repeat_stride输入源操作数1相邻迭代间相同DataBlock的地址步长。

返回值说明

流水类型

PIPE_V

约束说明

  • dst、src0、src1的起始地址需要32字节对齐。
  • 操作数地址重叠约束请参考通用地址重叠约束。

调用示例

// total_length指参与计算的数据总长度 constexpr uint64_t total_length = 128; __ubuf__ uint16_t src0[total_length]; __ubuf__ uint16_t src1[total_length]; __ubuf__ uint16_t dst[total_length]; uint8_t repeat = 1; uint8_t dst_block_stride = 1; uint8_t src0_block_stride = 1; uint8_t src1_block_stride = 1; uint8_t dst_repeat_stride = 8; uint8_t src0_repeat_stride = 8; uint8_t src1_repeat_stride = 8; asc_squeeze(dst, src0, src1, repeat, dst_block_stride, src0_block_stride, src1_block_stride, dst_repeat_stride, src0_repeat_stride, src1_repeat_stride);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/862338/

相关文章:

  • DownKyi跨平台版终极指南:B站视频下载与音视频分离完整教程
  • 专业级Windows媒体播放解决方案:mpv.net深度解析与进阶应用
  • 链游3.0时代:GameFi+NFT+SocialFi如何引爆万亿级“数字乌托邦“?
  • 如何用Sub组织多语言脚本:Bash、Python、Ruby混合开发实战
  • 三步搞定专业音频转录:Buzz让你的电脑秒变智能字幕工作站
  • 为什么Boilr能成为开发者必备工具:零依赖优势详解
  • 3大革新功能:无需解压直接在IDEA中编辑JAR包的智能插件
  • 交易所技术三重门:吞吐量、安全性与合规性的不可能三角破解之道
  • Keypatch兼容性指南:从IDA 6.4到7.5的完美运行
  • 3分钟快速上手:用downkyicore轻松提取B站音频的完整教程
  • 终极ChatGPT Web未来发展规划:功能扩展与技术演进路线图
  • 范戴克印相在AI时代的重生:基于CIE LAB色彩空间校准的Midjourney --raw参数深度优化方案(附实测ΔE<1.3数据报告)
  • 三步上手No!! MeiryoUI:轻松美化你的Windows字体界面
  • sdf完全入门指南:如何用5行代码生成你的第一个3D打印模型
  • CANN/metadef环境部署指南
  • RedisBloom未来展望:概率数据结构在AI时代的发展趋势
  • 从零开始:用Rufus打造你的万能系统启动盘
  • CryptoJS 加密库完整指南:5个核心功能深度解析
  • on-policy实战案例:构建你自己的多智能体强化学习系统
  • 终极Windows 11升级指南:如何绕过限制轻松升级旧设备
  • nProbe IPS模式配置教程:实现网络入侵防护的终极方案
  • 2026年评价高的江苏农业灌溉管材生产线/管材生产线/高速管材生产线/PPR管材生产线厂家精选合集 - 品牌宣传支持者
  • benchmark-ips源码剖析:理解Ruby性能测试的内部机制
  • VSCode 远程开发插件 WSL 与 SSH 模式区别是什么
  • 为什么你需要kubectl-node-shell:10个Kubernetes节点故障排查技巧 [特殊字符]
  • 【Midjourney扁平化风格实战指南】:零基础3步生成高转化UI图标,设计师私藏Prompt库首次公开
  • Agent Framework中的混合工作流设计
  • 软件研发 --- 应知应会 之 什么是云计算开发
  • 2026年推荐几家哈尔滨铜门/哈尔滨商业铜门/黑龙江磁悬浮极简门精选推荐公司 - 行业平台推荐
  • WuWa-Mod:创新高效的《鸣潮》游戏模组解决方案,解锁无限游戏体验