当前位置: 首页 > news >正文

CANN/asc-devkit int64转int32向量转换

asc_int642int32

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

将vector_int64_t类型的源操作数转换成vector_int32_t类型,写入目的操作数的上半部分或下半部分,并支持不同的饱和模式:

  • asc_int642int32:不饱和模式,写入目的操作数的上半部分。

  • asc_int642int32_sat:饱和模式,写入目的操作数的上半部分。

  • asc_int642int32_v2:不饱和模式,写入目的操作数的下半部分。

  • asc_int642int32_sat_v2:饱和模式,写入目的操作数的下半部分。

函数原型

__simd_callee__ inline void asc_int642int32(vector_int32_t& dst, vector_int64_t src, vector_bool mask) __simd_callee__ inline void asc_int642int32_sat(vector_int32_t& dst, vector_int64_t src, vector_bool mask) __simd_callee__ inline void asc_int642int32_v2(vector_int32_t& dst, vector_int64_t src, vector_bool mask) __simd_callee__ inline void asc_int642int32_sat_v2(vector_int32_t& dst, vector_int64_t src, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器)。
src输入源操作数(矢量数据寄存器)。
mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

  • 使能饱和模式和非饱和模式生效时,需配置ctrl寄存器,ctrl寄存器的详细说明请参见asc_set_ctrl.md。

调用示例

vector_int32_t dst; vector_int64_t src; vector_bool mask; asc_int642int32(dst, src, mask); // 不饱和模式,将src转换成vector_int32_t类型并写入dst的上半部分 asc_int642int32_sat(dst, src, mask); // 饱和模式,将src转换成vector_int32_t类型并写入dst的上半部分 asc_int642int32_v2(dst, src, mask); // 不饱和模式,将src转换成vector_int32_t类型并写入dst的下半部分 asc_int642int32_sat_v2(dst, src, mask); // 饱和模式,将src转换成vector_int32_t类型并写入dst的下半部分

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/862182/

相关文章:

  • 易魔声:2000+音色免费开源TTS引擎完全指南
  • MediaCrawler:企业级社交媒体数据采集的终极架构实践
  • CANN/pypto one_hot操作文档
  • 终极搜索动画指南:ENSearchView如何为你的Android应用增添视觉盛宴
  • 终极指南:如何使用nodeenv在CI/CD流水线中快速搭建隔离的Node.js环境
  • 蘑菇博客移动端开发实战:uniapp+ColorUI构建跨平台博客应用
  • CANN/pypto CODEGEN组件错误码
  • 2026年知名的化工原料葡萄糖/佛山化工原料硫酸铵生产厂家推荐 - 行业平台推荐
  • 3分钟学会Rufus:Windows系统安装盘制作终极指南,告别复杂操作!
  • 2026年整箱低盐萝卜干精选推荐公司 - 品牌宣传支持者
  • 昇腾CANN atvc:向量算子模板库的核心理念和踩坑指南
  • 3分钟一键获取百度网盘提取码:自动化查询实战指南
  • 终极Chrome自动化指南:使用AutoHotkey实现浏览器自动操作
  • 文字修仙项目市场价值与商业化分析
  • GeoAI性能优化技巧:如何充分利用GPU加速地理空间AI计算
  • 围棋AI训练平台KaTrain:免费智能教练的终极使用指南
  • 全志T113 Tina5.0开发:(零)源码下载修改调试串口
  • 叠合式vs组合式,组合截面如何计算?
  • CANN asc-devkit bfloat16转fp4x2函数
  • 把“地基“还给内容:从80万在读凡人流IP看漫改长青之路,SoundView情感配音如何让好故事「声」入人心?
  • 昇腾CANN community:开源社区的运作机制和参与路径
  • 终极破解:如何深度掌控JetBrains IDE评估期重置技术?
  • 深度解析AI驱动的Verilog代码生成:3步实战提升硬件设计效率
  • 5分钟快速上手eLabFTW:免费开源的终极电子实验室笔记本
  • Bpmn Process Designer性能优化指南:大型流程图的渲染与交互优化
  • Rufus终极指南:如何轻松制作Windows和Linux启动盘,告别安装烦恼!
  • LazyCache异步缓存实战指南:如何高效缓存数据库查询结果
  • OptScale 安全最佳实践:10个关键步骤保护你的云成本数据和配置
  • CANN/pypto tril函数API文档
  • 洞见规范---幕墙性能之十三太保---防火性能