当前位置: 首页 > news >正文

CANN/asc-devkit bfloat16x2比较函数

__hblex2

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品x
Atlas A2 训练系列产品/Atlas A2 推理系列产品x
Atlas 200I/500 A2 推理产品x
Atlas 推理系列产品AI Corex
Atlas 推理系列产品Vector Corex
Atlas 训练系列产品x

功能说明

比较两个bfloat16x2_t类型数据的两个分量,仅当两个分量均满足第一个数小于或等于第二个数时,返回true。

函数原型

bool __hblex2(bfloat16x2_t x, bfloat16x2_t y)

参数说明

表 1参数说明

参数名输入/输出描述
x输入源操作数。
y输入源操作数。

返回值说明

比较输入各分量是否均满足第一个数小于或等于第二个数的结果。

  • true:各分量均满足第一个数小于或等于第二个数。
  • false:任一分量不满足第一个数小于或等于第二个数。任一输入的分量为nan,该分量的比较结果为false。

约束说明

需要包含的头文件

使用该接口需要包含"simt_api/asc_bf16.h"头文件。

#include "simt_api/asc_bf16.h"

调用示例

  • SIMT编程场景:

    // 使用短向量可提升数据搬运效率 __global__ __launch_bounds__(1024) void simt_hblex2(bfloat16_t* x, bfloat16_t* y, bool* dst, uint32_t input_total_length) { uint32_t idx = blockIdx.x * blockDim.x + threadIdx.x; // 每个线程处理1个bfloat16x2_t类型的数据,即2个bfloat16_t类型的数据,因此idx >= input_total_length / 2的线程不处理数据 if (idx >= input_total_length / 2) { return; } bfloat16x2_t* input1 = (bfloat16x2_t*)x; bfloat16x2_t* input2 = (bfloat16x2_t*)y; dst[idx] = __hblex2(input1[idx], input2[idx]); }
  • SIMD与SIMT混合编程场景:

    // 使用短向量可提升数据搬运效率 __simt_vf__ __launch_bounds__(1024) inline void simt_hblex2(__gm__ bfloat16x2_t* x, __gm__ bfloat16x2_t* y, __gm__ bool* dst, uint32_t input_total_length) { uint32_t idx = blockIdx.x * blockDim.x + threadIdx.x; // 每个线程处理1个bfloat16x2_t类型的数据,即2个bfloat16_t类型的数据,因此idx >= input_total_length / 2的线程不处理数据 if (idx >= input_total_length / 2) { return; } dst[idx] = __hblex2(x[idx], y[idx]); } __global__ __vector__ void compare_kernel(__gm__ bfloat16_t* x, __gm__ bfloat16_t* y, __gm__ bool* dst, uint32_t input_total_length) { asc_vf_call<simt_hblex2>(dim3(1024), (__gm__ bfloat16x2_t*)x, (__gm__ bfloat16x2_t*)y, dst, input_total_length); }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/857112/

相关文章:

  • 2026铜川市耀州区黄金回收铂金回收白银回收深度实测 五大正规门店横屏 报价透明 免费上门才是真靠谱 - 亦辰小黄鸭
  • React PDF Highlighter:React PDF文档高亮注释完整指南
  • 番茄小说下载器完整指南:3种方法轻松搭建个人离线图书馆
  • 抖音批量下载神器:开源工具完整使用指南
  • 2026铜川市印台区黄金回收铂金回收白银回收深度实测 五大正规门店横屏 报价透明 免费上门才是真靠谱 - 亦辰小黄鸭
  • 2026宜宾市翠屏区黄金回收铂金回收白银回收深度实测 五大正规门店横屏 报价透明 免费上门才是真靠谱 - 亦辰小黄鸭
  • Perplexity语言学习资源私密工作流(内部学员专享):基于CEFR B2+真实语料库构建的动态难度调节模型
  • 如何在Android设备上获得终极动漫观影体验:Hanime1插件完整指南
  • 2026铜陵市郊区黄金回收铂金回收白银回收深度实测 五大正规门店横屏 报价透明 免费上门才是真靠谱 - 亦辰小黄鸭
  • oidc-client-ts与主流框架集成:React、Angular、Vue实战指南
  • ROS机器人仿真平台深度解析:从Gazebo集成到多模态感知系统架构设计
  • 2026年留学生就业避风港:如何利用“免抽签”工签实现稳定留美与职业跃迁
  • 2026宜宾市南溪区黄金回收铂金回收白银回收深度实测 五大正规门店横屏 报价透明 免费上门才是真靠谱 - 亦辰小黄鸭
  • 用Verilog和FPGA实现正交调制解调:一个96通道CW信号处理的完整工程复盘
  • 如何在15分钟内用wpr_simulation搭建你的第一个机器人仿真环境 [特殊字符]
  • 告别乱码!手把手教你用PCtoLCD2002给ESP8266的OLED屏取模显示中文(附完整代码)
  • 算法题遇到的技巧和心得
  • 数据血缘是什么?一数据血缘、数据质量和数据地图的区别是什么?
  • 别再只仿真了!Simulink步进电机模型如何关联真实Arduino驱动器?
  • 《Windows Sysinternals实战指南》VMMap 学习笔记(8.8):恢复默认视图、清理环境与分析后“归零”技巧
  • Thorium浏览器:基于Chromium的极致性能优化与隐私保护技术深度解析
  • 2026宜宾市叙州区黄金回收铂金回收白银回收深度实测 五大正规门店横屏 报价透明 免费上门才是真靠谱 - 亦辰小黄鸭
  • ARM GIC与Zynq中断架构详解:从通用原理到PL/PS实战配置
  • 避坑指南:ESP32-S3驱动ILI9488+LVGL时,GT911触摸屏方向与镜像问题的终极解决
  • ShizuTools LookBack功能剖析:无需卸载即可降级应用的原理与实现
  • 如何深度优化Wand应用体验:Wand-Enhancer配置增强实践指南
  • LVGL按钮(lv_btn)与开关(lv_switch)事件处理全解析:从点击检测到实现‘智能家居面板’
  • Omnizart完整功能清单:从人声旋律到鼓点节奏的一站式解决方案
  • Legacy iOS Kit:让旧iPhone重获新生的终极降级工具
  • FPGA驱动RGB屏幕时序详解:从VGA原理到480x272实战调试笔记