当前位置: 首页 > news >正文

CANN/asc-devkit:Half转BFloat16 SIMD API

asc_half2bfloat16

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

将half类型数据转为bfloat16类型,并支持多种舍入模式。

  • RINT舍入模式:四舍六入五成双舍入
  • ROUND舍入模式:四舍五入舍入
  • FLOOR舍入模式:向负无穷舍入
  • CEIL舍入模式:向正无穷舍入
  • TRUNC舍入模式:向零舍入

函数原型

// FLOOR舍入模式 __simd_callee__ inline void asc_half2bfloat16_rd(vector_bfloat16_t& dst, vector_half src, vector_bool mask) // RINT舍入模式 __simd_callee__ inline void asc_half2bfloat16_rn(vector_bfloat16_t& dst, vector_half src, vector_bool mask) // ROUND舍入模式 __simd_callee__ inline void asc_half2bfloat16_rna(vector_bfloat16_t& dst, vector_half src, vector_bool mask) // CEIL舍入模式 __simd_callee__ inline void asc_half2bfloat16_ru(vector_bfloat16_t& dst, vector_half src, vector_bool mask) // TRUNC舍入模式 __simd_callee__ inline void asc_half2bfloat16_rz(vector_bfloat16_t& dst, vector_half src, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器)。
src输入源操作数(矢量数据寄存器)。
mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

vector_half src; vector_bfloat16_t dst; vector_bool mask = asc_create_mask_b16(PAT_ALL); asc_loadalign(src, src_addr); // src_addr是外部输入的UB内存空间地址。 asc_half2bfloat16_rna(dst, src, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/867542/

相关文章:

  • 2026年Q2长沙白银回收机构排行及实用选择指南:长沙银元回收、长沙银元抵押、长沙黄金回收、长沙名包回收、长沙名包抵押选择指南 - 优质品牌商家
  • 有哪些一键生成论文工具是真的贴合学术规范,而不是模板套话?
  • 最后一行代码
  • ASP Folder:深入解析ASP文件夹的结构与功能
  • 3步解锁网易云音乐NCM文件:免费转换工具终极指南
  • 2026年5月深圳除甲醛公司推荐:五大排行专业评测性价比高价格 - 品牌推荐
  • CANN/pypto copysign函数API文档
  • 一文读懂如何申报国家企业技术中心(条件、流程、好处)
  • 空气动力学计算 · 趋势图谱(学生学习版)
  • 如何完全掌握Kemono图片下载工具:5大实战技巧深度指南 [特殊字符]
  • 如何一站式解决Windows程序运行库依赖问题
  • 如何免费激活Windows和Office:3步实现永久激活的终极指南
  • 为内部知识问答系统构建基于多模型聚合的智能回复引擎
  • 【Typescript】11-类抽象类与面向对象建模
  • 西南文创礼品定制技术拆解:高端礼品定制/会议纪念礼品/各类礼品团购/商务礼品定制/成都礼品批量定制/成都礼品批量订制/选择指南 - 优质品牌商家
  • 庞加莱猜想:哲学 × 数学 思维范式全链条
  • Stargazer AI Copilot Desktop 使用说明
  • 0x.Tools快速入门:10分钟内掌握Linux系统性能分析
  • 3个步骤掌握Betaflight飞控固件:从零开始打造专业级无人机飞行体验
  • 咋选北京装修公司?2026年5月推荐TOP10对比旧房翻新防超支评测适用场景特点 - 品牌推荐
  • 【Typescript】12-模块声明文件与第三方库
  • PHP 文件:深入解析与最佳实践
  • 【Sora 2批量视频生成黄金工作流】:实测吞吐提升4.8倍的关键配置——NVIDIA A100集群下每小时稳定输出217段1080p视频
  • WireUI颜色选择器和日期选择器:提升用户体验的利器 [特殊字符][特殊字符]
  • 如何选择深度学习数据集?Awesome Deep Learning Resources 实用资源解析
  • 创业公司如何利用 Taotoken 统一管理多个 AI 模型服务
  • Solaar 4.0:解锁罗技设备的完整Linux管理体验
  • 【Typescript】13-tsconfig与工程化实践
  • Sora 2提示词失效真相大起底(92%用户踩中的3类语义断层陷阱)
  • 2026年5月北京老房改造装修公司推荐:TOP5排名专业评测防隐患价格 - 品牌推荐