当前位置: 首页 > news >正文

CANN/asc-devkit:浮点数转bfloat16函数

asc_float2bfloat16

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

将vector_float类型转换成vector_bfloat16_t类型,写入目的操作数的上半部分或下半部分,并支持多种舍入模式与饱和模式:

  • RINT舍入模式:四舍六入五成双舍入。

  • ROUND舍入模式:四舍五入舍入。

  • FLOOR舍入模式:向负无穷舍入。

  • CEIL舍入模式:向正无穷舍入。

  • TRUNC舍入模式:向零舍入。

以asc_float2bfloat16_rd接口为例:

  • asc_float2bfloat16_rd:不饱和模式,写入目的操作数的上半部分。

  • asc_float2bfloat16_rd_sat:饱和模式,写入目的操作数的上半部分。

  • asc_float2bfloat16_rd_v2:不饱和模式,写入目的操作数的下半部分。

  • asc_float2bfloat16_rd_sat_v2:饱和模式,写入目的操作数的下半部分。

函数原型

// FLOOR舍入模式 __simd_callee__ inline void asc_float2bfloat16_rd(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rd_sat(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rd_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rd_sat_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask) // RINT舍入模式 __simd_callee__ inline void asc_float2bfloat16_rn(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rn_sat(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rn_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rn_sat_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask) // ROUND舍入模式 __simd_callee__ inline void asc_float2bfloat16_rna(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rna_sat(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rna_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rna_sat_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask) // CEIL舍入模式 __simd_callee__ inline void asc_float2bfloat16_ru(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_ru_sat(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_ru_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_ru_sat_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask) // TRUNC舍入模式 __simd_callee__ inline void asc_float2bfloat16_rz(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rz_sat(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rz_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_float2bfloat16_rz_sat_v2(vector_bfloat16_t& dst, vector_float src, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器)。
src输入源操作数(矢量数据寄存器)。
mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

  • 开启饱和模式和非饱和模式时,需配置ctrl寄存器,ctrl寄存器的详细说明请参见asc_set_ctrl.md。

调用示例

vector_bfloat16_t dst; vector_float src; vector_bool mask; asc_float2bfloat16_rd(dst, src, mask); // FLOOR舍入模式,不饱和模式,将src转换成vector_bfloat16_t类型并写入dst上半部分 asc_float2bfloat16_rd_sat(dst, src, mask); // FLOOR舍入模式,饱和模式,将src转换成vector_bfloat16_t类型并写入dst上半部分 asc_float2bfloat16_rd_v2(dst, src, mask); // FLOOR舍入模式,不饱和模式,将src转换成vector_bfloat16_t类型并写入dst下半部分 asc_float2bfloat16_rd_sat_v2(dst, src, mask); // FLOOR舍入模式,饱和模式,将src转换成vector_bfloat16_t类型并写入dst下半部分

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1042665/

相关文章:

  • 上海奢侈品回收实测:江诗丹顿、欧米茄海马当场估价秒结全款 - 逸程
  • 2026宿州放心贵金属回收,CCIC 中检授权收黄金回收铂金回收白银回收持证实体门店 - 中安检金银铂钻回收
  • 攻克RepeatMasker数据库合并难题:Dfam3.6与RepBase整合实战与TypeError报错深度解析
  • 2026年6月评价高的氟塑料化工泵/不锈钢化工泵厂家推荐硕博环保,轻量化泵体减少厂房基建安装成本 - 品牌鉴赏师
  • smallworld.js地图性能优化指南:从GeoJSON简化到Canvas渲染效率提升
  • 快速上手javascript-typescript-langserver:5分钟搭建你自己的TypeScript语言服务器
  • 魔都黄金回收暗访实录:24小时上门实测闵行、浦东、松江、静安、普陀五家临街老店,谁才是最良心之选? - 昌福黄金回收
  • IronOS深度解析:开源焊锡铁固件的实战应用与性能优化
  • MC9S08SG32定时器深度解析:MTIM与RTC原理、配置与低功耗设计
  • oam-tools AI运行时性能数据采集
  • OpenFoodFacts-androidapp多语言支持:如何为全球用户提供本地化食品信息
  • 神奇弹幕:B站直播互动效率提升300%的终极指南
  • 2026忻州放心贵金属回收,CCIC 中检授权收黄金回收铂金回收白银回收持证实体门店 - 中安检金银铂钻回收
  • Simple Thermostat 故障排除:常见问题与解决方案大全
  • WebHaptics高级技巧:创建自定义触感预设与动态强度控制
  • Agent 系列(22):Context Engineering 深度——三种上下文管理策略的量化对比
  • Catcher核心功能详解:从异常捕获到多平台错误处理
  • UVa 538 Balancing Bank Accounts
  • 深入解析S12 MSCAN模块:硬件保护、时钟配置与低功耗设计实战
  • 思源宋体终极指南:7种字重免费开源字体解决你的中文排版难题
  • RevokeMsgPatcher深度解密:Windows平台即时通讯软件二进制补丁完整技术手册
  • 大模型转型攻略:小白程序员轻松入门,收藏这份从零到精通的学习指南!
  • ThumbmarkJS架构解析:从工厂模式到组件管理的设计哲学
  • MPC555/556微控制器架构解析:PowerPC内核、IMB总线与关键外设实战
  • MC9S12KG128内存映射控制(MMCV4)详解:突破64KB限制的嵌入式开发实战
  • Numix图标主题与Numix Circle、Numix Square的完美组合方案
  • Beyond Compare 5密钥生成器:3种终极解决方案完整指南
  • 5分钟快速掌握Android设备终极优化:Universal Android Debloater完整指南
  • 构建MLflow+Kubeflow协同架构:实现企业级机器学习平台工程化
  • Photoshop图层导出革命:如何用脚本引擎将设计效率提升90倍