当前位置: 首页 > news >正文

CANN/asc-devkit浮点到FP8转换API

asc_float2e4m3

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

将float类型转化为fp8_e4m3fn_t类型,支持RINT舍入模式。

根据输入数据的大小分为非饱和模式和饱和模式。

  • 非饱和模式:
    • 输入数据超过输出类型最值时,返回输出类型的对应符号inf值。
    • 输入数据为+/-inf时, 返回+/-inf。
    • 输入数据为nan时,返回nan。
  • 饱和模式:
    • 输入数据超过输出类型最值时,返回输出类型的对应最值。
    • 输入数据为+/-inf时, 返回输出类型的对应最值。
    • 输入数据为nan时,返回0。

由于源操作数与目的操作数类型位宽比为4:1,写入数据时需要将一个VL大小的数据分为四部分,根据不同接口选取索引0、索引1、索引2或者索引3。

函数原型

// RINT舍入模式,非饱和模式,数据写入索引为0的位置 __simd_callee__ inline void asc_float2e4m3_rn(vector_fp8_e4m3fn_t& dst, vector_float src, vector_bool mask) // RINT舍入模式,饱和模式,数据写入索引为0的位置 __simd_callee__ inline void asc_float2e4m3_rn_sat(vector_fp8_e4m3fn_t& dst, vector_float src, vector_bool mask) // RINT舍入模式,非饱和模式,数据写入索引为1的位置 __simd_callee__ inline void asc_float2e4m3_rn_v2(vector_fp8_e4m3fn_t& dst, vector_float src, vector_bool mask) // RINT舍入模式,饱和模式,数据写入索引为1的位置 __simd_callee__ inline void asc_float2e4m3_rn_sat_v2(vector_fp8_e4m3fn_t& dst, vector_float src, vector_bool mask) // RINT舍入模式,非饱和模式,数据写入索引为2的位置 __simd_callee__ inline void asc_float2e4m3_rn_v3(vector_fp8_e4m3fn_t& dst, vector_float src, vector_bool mask) // RINT舍入模式,饱和模式,数据写入索引为2的位置 __simd_callee__ inline void asc_float2e4m3_rn_sat_v3(vector_fp8_e4m3fn_t& dst, vector_float src, vector_bool mask) // RINT舍入模式,非饱和模式,数据写入索引为3的位置 __simd_callee__ inline void asc_float2e4m3_rn_v4(vector_fp8_e4m3fn_t& dst, vector_float src, vector_bool mask) // RINT舍入模式,饱和模式,数据写入索引为3的位置 __simd_callee__ inline void asc_float2e4m3_rn_sat_v4(vector_fp8_e4m3fn_t& dst, vector_float src, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器)。
src输入源操作数(矢量数据寄存器)。
mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

  • 使能饱和模式和非饱和模式生效时,需配置ctrl寄存器,ctrl寄存器的详细说明请参见asc_set_ctrl.md。

调用示例

vector_float src; vector_fp8_e4m3fn_t dst; vector_bool mask; asc_float2e4m3_rn(dst, src, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/867465/

相关文章:

  • 2026年可以自考本科畜牧兽医吗?就业前景怎么样?选择四川小自考助你快速拿证! - 知名不具123
  • 2026年5月最新贵阳息烽黄金回收白银回收铂金回收权威排行榜TOP5:纯金+金条+银条+钯金 门店地址联系方式推荐 - 金诚回收
  • 如何自定义Sobelow规则:扩展你的安全检测能力
  • 2026年5月最新甘孜康定黄金回收白银回收铂金回收权威排行榜TOP5:纯金+金条+银条+钯金 门店地址联系方式推荐 - 金诚回收
  • JVM内存结构与OOM问题排查
  • Go语言六边形架构:端口与适配器
  • OpenCorePkg黑苹果引导配置:从传统引导到现代解决方案的完整迁移指南
  • Jooby性能优化秘籍:让你的Web应用快如闪电 [特殊字符]
  • 2026年5月最新齐齐哈尔泰来黄金回收白银回收铂金回收权威排行榜TOP5:纯金+金条+银条+钯金 门店地址联系方式推荐 - 诚信金利回收
  • 2026 年 GEO 行业大洗牌:90% SEO 公司将被淘汰,真正的机会在这里 - 商业科技观察
  • CANN/asc-devkit浮点转hif8 API
  • 少走弯路:2026 降AIGC平台测评与推荐指南
  • 铜钟音乐:在信息洪流中找回纯粹听歌体验的现代Web应用
  • 终极B站直播助手:3分钟搭建智能直播间,效率提升300%
  • Wannakey:无需支付赎金,从内存中恢复WannaCry加密文件
  • 2026年5月最新齐齐哈尔铁锋黄金回收白银回收铂金回收权威排行榜TOP5:纯金+金条+银条+钯金 门店地址联系方式推荐 - 诚信金利回收
  • 2026年5月最新乐山峨眉山黄金回收白银回收铂金回收权威排行榜TOP5:纯金+金条+银条+钯金 门店地址联系方式推荐 - 五金回收
  • 一家工厂的“打样能力“怎么从外部判断?一份给跨境卖家与新品牌的甄别清单
  • 电子书转有声书完整指南:一键实现1158种语言的AI语音合成
  • B站直播神器:神奇弹幕全方位操作指南
  • 2026年10款降AI率工具实测:最高AI率100%直降至0.12%
  • 2026北京迷你自助仓储服务机构综合评估榜单——5家本地仓储服务主体对比与推荐参考 - 企业深度横评dyy6420
  • 2026年5月最新泉州泉港黄金回收白银回收铂金回收权威排行榜TOP5:纯金+金条+银条+钯金 门店地址联系方式推荐 - 诚信金利回收
  • 2026年5月最新内江威远黄金回收白银回收铂金回收权威排行榜TOP5:纯金+金条+银条+钯金 门店地址联系方式推荐 - 诚信金利回收
  • 2026年5月最新泉州石狮黄金回收白银回收铂金回收权威排行榜TOP5:纯金+金条+银条+钯金 门店地址联系方式推荐 - 诚信金利回收
  • SABIC塑料:2026年精选十大高品质产品权威榜单揭晓,重塑行业新选择
  • Qt5 super module网络编程指南:WebSocket、HTTP、MQTT通信实现
  • 纯JavaScript生成CAD图纸:浏览器端工程绘图的突破性方案
  • Qt5 super module跨平台开发实战:Windows、macOS、Linux三端部署指南
  • 2026年5月最新福州连江黄金回收白银回收铂金回收权威排行榜TOP5:纯金+金条+银条+钯金 门店地址联系方式推荐 - 金诚回收