当前位置: 首页 > news >正文

CANN/asc-devkit bfloat16x2 NaN判断函数

__isnanx2

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品x
Atlas A2 训练系列产品/Atlas A2 推理系列产品x
Atlas 200I/500 A2 推理产品x
Atlas 推理系列产品AI Corex
Atlas 推理系列产品Vector Corex
Atlas 训练系列产品x

功能说明

判断bfloat16x2_t类型数据的两个分量是否为nan。

函数原型

bfloat16x2_t __isnanx2(bfloat16x2_t x)

参数说明

表 1参数说明

参数名输入/输出描述
x输入源操作数。

返回值说明

判断输入数据各分量是否为nan,为nan时对应分量结果为1.0,否则为0.0。

约束说明

需要包含的头文件

使用该接口需要包含"simt_api/asc_bf16.h"头文件。

#include "simt_api/asc_bf16.h"

调用示例

  • SIMT编程场景:

    // 使用短向量可提升数据搬运效率 __global__ __launch_bounds__(1024) void simt_isnanx2(bfloat16_t* x, bfloat16_t* dst, uint32_t input_total_length) { uint32_t idx = blockIdx.x * blockDim.x + threadIdx.x; // 每个线程处理1个bfloat16x2_t类型的数据,即2个bfloat16_t类型的数据,因此idx >= input_total_length / 2的线程不处理数据 if (idx >= input_total_length / 2) { return; } bfloat16x2_t* input = (bfloat16x2_t*)x; bfloat16x2_t* out = (bfloat16x2_t*)dst; out[idx] = __isnanx2(input[idx]); }
  • SIMD与SIMT混合编程场景:

    // 使用短向量可提升数据搬运效率 __simt_vf__ __launch_bounds__(1024) inline void simt_isnanx2(__gm__ bfloat16x2_t* x, __gm__ bfloat16x2_t* dst, uint32_t input_total_length) { uint32_t idx = blockIdx.x * blockDim.x + threadIdx.x; // 每个线程处理1个bfloat16x2_t类型的数据,即2个bfloat16_t类型的数据,因此idx >= input_total_length / 2的线程不处理数据 if (idx >= input_total_length / 2) { return; } dst[idx] = __isnanx2(x[idx]); } __global__ __vector__ void compute_kernel(__gm__ bfloat16_t* x, __gm__ bfloat16_t* dst, uint32_t input_total_length) { asc_vf_call<simt_isnanx2>(dim3(1024), (__gm__ bfloat16x2_t*)x, (__gm__ bfloat16x2_t*)dst, input_total_length); }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/858889/

相关文章:

  • OmenSuperHub:惠普游戏本性能优化的终极免费解决方案
  • YimMenu:GTA V终极开源菜单的完整实战指南
  • 我看了一个把 SAP 和 AI 真接上的仓库,vibing-steampunk 到底能干嘛
  • 3步解锁Steam Deck在Windows平台的完整游戏体验:SWICD控制器驱动深度指南
  • MCU 也能跑 Linux?小身材兼容大平台
  • 版型出众,质感在线,优质男装裤品牌精选 - 资讯速览
  • 告别数据锁定:用youdaonote-pull实现有道云笔记的本地化自由
  • kagent UI使用教程:通过Web界面轻松管理你的AI代理
  • ElevenLabs老挝文语音冷启动秘籍:零样本音色克隆+老挝语单音节基元库构建(附GitHub私有Repo邀请码,限前200名开发者)
  • 3步掌握gibMacOS:解锁跨平台获取纯净macOS安装包的完整指南
  • Windhawk终极指南:免费开源Windows定制工具完整教程
  • AI编程助手的现状与未来:Copilot、CodeLlama与GPT-4
  • GetQzonehistory终极指南:3分钟实现QQ空间历史数据完整备份
  • 终极指南:如何确保C++ expected库在Clang 3.5到GCC 10的完整编译器兼容性
  • 终极指南:如何用Onekey快速免费下载Steam游戏清单
  • 2026年西安商业空间与高端私宅设计全案指南:刘红旺与张劲夫双设计师深度对标 - 精选优质企业推荐官
  • TurboVNC终极指南:如何快速搭建高性能远程桌面系统
  • ElevenLabs山西话语音落地实战:3步完成方言模型微调、5类常见发音失真修复方案
  • 为AI智能体OpenClaw配置Taotoken作为后端模型服务
  • 广东权威LOGO设计公司:世答创意的专业服务全解析 - 奔跑123
  • CANN/asc-devkit C API通用说明
  • HEIC缩略图生成技术实现:Windows Shell扩展架构解析与性能优化
  • 终极指南:如何在英雄联盟国服免费使用R3nzSkin换肤工具体验所有皮肤
  • 关于MySQL更新数据后自动更新updatetime字段的值
  • Omnizart代码实现原理:解密音乐AI背后的深度学习算法
  • 视觉SLAM非线性优化完全指南:从BA优化到位姿估计的终极教程
  • ODT怎么转PDF?2026年实测5种转换方法与在线工具对比
  • duti与macOS Launch Services:底层机制与实现原理剖析
  • Cursor Pro破解工具完整指南:轻松实现AI编程助手免费使用方案
  • 免费NCM转换终极指南:3分钟破解网易云音乐加密格式