当前位置: 首页 > news >正文

CANN/asc-devkit SIMD int32转float函数

asc_int322float

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

将int32_t类型转化为float类型,并支持多种舍入模式。

  • RINT舍入模式:四舍六入五成双舍入
  • ROUND舍入模式:四舍五入舍入
  • FLOOR舍入模式:向负无穷舍入
  • CEIL舍入模式:向正无穷舍入
  • TRUNC舍入模式:向零舍入

函数原型

// RINT舍入模式 __simd_callee__ inline void asc_int322float_rn(vector_float& dst, vector_int32_t src, vector_bool mask) // ROUND舍入模式 __simd_callee__ inline void asc_int322float_rna(vector_float& dst, vector_int32_t src, vector_bool mask) // FLOOR舍入模式 __simd_callee__ inline void asc_int322float_rd(vector_float& dst, vector_int32_t src, vector_bool mask) // CEIL舍入模式 __simd_callee__ inline void asc_int322float_ru(vector_float& dst, vector_int32_t src, vector_bool mask) // TRUNC舍入模式 __simd_callee__ inline void asc_int322float_rz(vector_float& dst, vector_int32_t src, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器)。
src输入源操作数(矢量数据寄存器)。
mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

vector_int32_t src; vector_float dst; vector_bool mask = asc_create_mask_b32(PAT_ALL); asc_loadalign(src, src_addr); // src_addr是外部输入的UB内存空间地址。 asc_int322float_rn(dst, src, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1040695/

相关文章:

  • 2026年值得信赖的反应釜靠谱厂家推荐,体验服务品质之选 - mypinpai
  • Playnite开源游戏库管理神器:三招解决多平台游戏统一管理痛点
  • 高效利用Microchip开发资源:从工具链到实战调试全解析
  • 2027 成都明阳单招开班放大招!预报立减千元,一站式升学服务全曝光 - 成都单招培训
  • 如何快速上手Unity2D Components:初学者必备的10个核心组件
  • 2027 成都融创全新升级|智能化教学体系上线,官方咨询渠道统一公布 - 成都单招培训
  • 4层纵深防御:构建企业级API安全防护体系
  • 2026年6月大型污水处理厂便携式污泥浓度计十大品牌排名:基于市政水务实测数据的技术量化与选型深度分析 - 仪表品牌榜
  • 2026年值得信赖的智能果汁灌装机厂家推荐,体验服务品质之选 - mypinpai
  • 揭秘ZLUDA:让非NVIDIA显卡运行CUDA程序的深度指南
  • 基于YOLOv8的柠檬识别 柠檬分拣检测系统 柠檬等级检测系统设计
  • Loop:重新定义macOS窗口管理的优雅之道
  • 2026防火软接实力口碑榜 采购商照着选不踩坑价格透明 - mypinpai
  • 10个高效使用Tag Editor的技巧:批量编辑、脚本处理和自动重命名
  • Adobe开源中心:探索Adobe开源项目的完整指南
  • CANN/asc-devkit int16转uint8函数
  • PCI总线事务深度解析:从信号交互到配置访问与错误处理
  • 高速ADC芯片MCP37D20-200:数字下变频与PLL时钟配置实战解析
  • 深入解析Motorola MMC2107开发板:从内存映射到裸机调试实战
  • Paralayout入门指南:10分钟掌握iOS像素完美布局神器
  • Bamboo:Mesos Marathon的终极HAProxy自动配置和发现工具指南 [特殊字符]
  • 如何用IP-Adapter-FaceID轻松实现AI人脸生成:从零开始的完整指南
  • 通风配件专业供应商十大实力厂家解析,零套路采购放心之选 - mypinpai
  • Numix图标主题性能优化:如何让图标加载更快、内存占用更少
  • compose-for-agents核心组件解析:从Docker容器到MCP工具集的完整架构
  • NSK W2507FA滚珠丝杠技术手册
  • JSBrowser标题栏定制:Windows Runtime API实现品牌化界面的快速教程 [特殊字符]
  • 深入解析Playwright Java中Browser类:从核心原理到实战应用
  • MHmarkets:围绕执行效率与流程清晰度的要点复盘
  • 3步搞定跨平台局域网文件传输:LANDrop终极解决方案