当前位置: 首页 > news >正文

CANN/asc-devkit:__hltu函数文档

__hltu

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品x
Atlas A2 训练系列产品/Atlas A2 推理系列产品x
Atlas 200I/500 A2 推理产品x
Atlas 推理系列产品AI Corex
Atlas 推理系列产品Vector Corex
Atlas 训练系列产品x

功能说明

比较两个half类型数据,当第一个数小于第二个数时,返回true。若任一输入为nan,返回true。

函数原型

bool __hltu(half x, half y)

参数说明

表 1参数说明

参数名输入/输出描述
x输入源操作数。
y输入源操作数。

返回值说明

比较输入的第一个数是否小于第二个数的结果。

  • true:第一个数小于第二个数。任一输入为nan时,返回true。
  • false:第一个数大于或等于第二个数。

约束说明

需要包含的头文件

使用该接口需要包含"simt_api/asc_fp16.h"头文件。

#include "simt_api/asc_fp16.h"

调用示例

  • SIMT编程场景:

    __global__ __launch_bounds__(1024) void KernelHltu(bool* dst, half* x, half* y) { int idx = threadIdx.x + blockIdx.x * blockDim.x; dst[idx] = __hltu(x[idx], y[idx]); }
  • SIMD与SIMT混合编程场景:

    __simt_vf__ __launch_bounds__(1024) inline void KernelHltu(__gm__ bool* dst, __gm__ half* x, __gm__ half* y) { int idx = threadIdx.x + blockIdx.x * blockDim.x; dst[idx] = __hltu(x[idx], y[idx]); }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/860985/

相关文章:

  • TEAMMATES测试策略详解:从单元测试到E2E测试的完整覆盖
  • 2026年5月新发布:锡林浩特近视防控实力商家深度解析与选择指南 - 2026年企业推荐榜
  • Linux 文件隐藏属性 chattr、lsattr 详解——锁住文件防误删(运维必备)
  • Orbit存储系统完全指南:SQLite、IndexedDB与Firestore三大方案深度解析
  • CANN算子数据类型列表配置
  • CANN/asc-devkit atanf函数文档
  • curtains.js实战案例:AJAX导航与平面移除的高级应用
  • 终极GTA5游戏助手:YimMenu完整实战指南
  • 中文Kodi媒体中心终极指南:4大本土化插件解决方案
  • SeekStorm入门指南:5分钟构建你的第一个高性能搜索引擎
  • ROCm rocr-libhsakmt分析系列3: aperture概念
  • 终极指南:如何彻底解决PHP Intelephense常见问题:索引失败、内存溢出、补全失效
  • 3小时重构视觉可信度:Midjourney拟物化风格紧急修复指南——含光照角度校准、微纹理叠加、物理反射模拟速查表
  • 5分钟掌握:跨平台获取官方macOS安装包的终极指南
  • FFXVIFix终极优化指南:5分钟解锁《最终幻想16》完美游戏体验
  • CMake基础:常用内部变量和环境变量的引用
  • Enumerize扩展模块:如何创建可重用的枚举定义
  • Octree-GS终极指南:如何用LOD结构化3D高斯实现实时大规模场景渲染
  • 10分钟掌握XGBoost:机器学习竞赛的终极梯度提升库
  • Midjourney纹理生成终极瓶颈曝光:GPU显存≠关键,真正卡点是CLIP文本嵌入层的纹理语义坍缩(附3种绕过方案)
  • 从elm-react-native学习React Native最佳实践:10个关键开发技巧
  • 不锈钢防火玻璃门——工程场景下安全与通透的平衡方案
  • Cookies.js 与其他Cookie库对比:终极优势分析与适用场景指南
  • OpenELB安全配置:RBAC、网络策略与证书管理最佳实践
  • 什么是换根DP及第一步操作说明
  • CANN/asc-devkit获取向量寄存器长度API
  • 案例11_2:液晶应用实例LCD1602(2)
  • SPlisHSPlasH部署与构建指南:Windows与Linux环境完整配置流程
  • Cookies.js 错误处理机制终极指南:编码异常与浏览器兼容性问题解决方案
  • Linux操作系统-逻辑卷管理(LVM)