当前位置: 首页 > news >正文

CANN/asc-devkit:asc_e2m1x22bfloat16函数

asc_e2m1x22bfloat16

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

将fp4x2_e2m1_t类型转化为bfloat16_t类型。

由于源操作数与目的操作数类型位宽比为1:4,读取数据时需要将一个VL大小的数据分为四部分,根据不同接口选取索引0、索引1、索引2或者索引3。

函数原型

// 读取索引0的位置 __simd_callee__ inline void asc_e2m1x22bfloat16(vector_bfloat16_t& dst, vector_fp4x2_e2m1_t src, vector_bool mask) // 读取索引1的位置 __simd_callee__ inline void asc_e2m1x22bfloat16_v2(vector_bfloat16_t& dst, vector_fp4x2_e2m1_t src, vector_bool mask) // 读取索引2的位置 __simd_callee__ inline void asc_e2m1x22bfloat16_v3(vector_bfloat16_t& dst, vector_fp4x2_e2m1_t src, vector_bool mask) // 读取索引3的位置 __simd_callee__ inline void asc_e2m1x22bfloat16_v4(vector_bfloat16_t& dst, vector_fp4x2_e2m1_t src, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器)。
src输入源操作数(矢量数据寄存器)。
mask输入源操作数掩码(矢量寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

vector_fp4x2_e2m1_t src; vector_bfloat16_t dst; vector_bool mask; asc_e2m1x22bfloat16(dst, src, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1045255/

相关文章:

  • nunif终极指南:10个技巧快速掌握2D视频转3D与图像放大技术
  • 5大智能方案:ZenlessZoneZero-OneDragon如何重新定义《绝区零》自动化体验
  • 新疆旅行社哪家靠谱?2024最新新疆旅行社口碑排行榜及防坑指南 - 企业推荐官【官方】
  • 如何快速部署Molten:5分钟搭建PHP分布式追踪系统
  • 2026年6月安徽VI设计实力企业选型指南:意赫创意的综合优势分析 - 品牌鉴赏官2026
  • 如何用biliTickerBuy告别B站会员购抢票焦虑?3步实现自动化购票
  • MC68HC908RF2A定时器PWM生成原理与实战:无缓冲与缓冲模式详解
  • 解密Visual C++运行库:3步彻底解决Windows软件兼容性问题
  • Crypto++ 实战:5分钟构建企业级C++加密方案库
  • MySQL查询优化的5个核心技巧与工具:快速提升数据库性能的终极指南
  • MCU系统集成模块(SIM)详解:复位、中断与低功耗管理实战
  • 3种创新方案解决Beyond Compare授权难题:如何选择最适合你的密钥生成策略?
  • FPGA_Webserver约束文件配置:Nexys Video开发板引脚分配与时序约束
  • 终极指南:使用TSDF-Fusion生成3D表面点云和网格模型
  • 程序员最值钱的不是电脑,而是代码!我把代码库搬回了自己服务器
  • 在银河麒麟V10桌面(2205版本)上实战部署软RAID 1:从模块黑名单到自动挂载
  • 掌握SiYuan块折叠:从混乱到有序的知识管理革命
  • HarmonyOS6踩坑记录之Navigation + Tabs 嵌套后路由栈全乱了?每个 Tab 独立 NavPathStack 才是正解
  • Hydra游戏启动器深度体验:从零搭建你的全平台智能游戏库
  • 完整指南:如何在64位Windows上高效运行16位应用程序
  • 2026上海防水补漏维修团队实测盘点TOP4:上海业主房屋渗漏修缮靠谱选择 - 宅安选房屋修缮
  • 从“Unexpected token”到顺畅编译:axios模块解析失败的深度排查与修复指南
  • 快速掌握Lagrange.Core:构建你的第一个C QQ机器人实战指南
  • 终极ESP32 Arduino开发完整指南:从零到项目实战的快速教程
  • 6%AFFF/AR抗溶性水成膜消防泡沫液口碑好的品牌是谁?浙江金瑞恒具备抗溶保护能力双重防护 - 品牌速递
  • DesktopSharing终极指南:如何快速搭建Windows桌面音视频流媒体服务器
  • Diffusion as Shader数据集制作指南:使用Blender创建合成训练数据
  • QGIS插件开发实战:从零到一构建你的第一个工具
  • CTF逆向实战:从EasySo看SO层函数Hook与动态调试
  • AI写作如何真正提升学术表达质量