当前位置: 首页 > news >正文

CANN/asc-devkit SIMT bfloat16数学函数

hfloor

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品x
Atlas A2 训练系列产品/Atlas A2 推理系列产品x
Atlas 200I/500 A2 推理产品x
Atlas 推理系列产品AI Corex
Atlas 推理系列产品Vector Corex
Atlas 训练系列产品x

功能说明

获取小于或等于输入数据的最大整数值。

函数原型

inline bfloat16_t hfloor(bfloat16_t x)

参数说明

表 1参数说明

参数名输入/输出描述
x输入源操作数。

返回值说明

小于或等于输入数据的最大整数值。本接口受全局饱和模式影响,特殊值如下:

x值非饱和模式返回值饱和模式返回值
infinfASCRT_MAX_NORMAL_BF16
-inf-inf-ASCRT_MAX_NORMAL_BF16
nannan0

约束说明

需要包含的头文件

使用bfloat16_t类型接口需要包含"simt_api/asc_bf16.h"头文件。

#include "simt_api/asc_bf16.h"

调用示例

  • SIMT编程场景:

    __global__ __launch_bounds__(1024) void KernelIsFinite(bfloat16_t* dst, bfloat16_t* x) { int idx = threadIdx.x + blockIdx.x * blockDim.x; dst[idx] = hfloor(x[idx]); }
  • SIMD与SIMT混合编程场景:

    __simt_vf__ __launch_bounds__(1024) inline void KernelIsFinite(__gm__ bfloat16_t* dst, __gm__ bfloat16_t* x) { int idx = threadIdx.x + blockIdx.x * blockDim.x; dst[idx] = hfloor(x[idx]); }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/860843/

相关文章:

  • SPlisHSPlasH粘度模拟技术详解:从标准方法到最新算法
  • Redux Framework与Metaboxes完美整合:如何在文章和页面中添加自定义字段
  • AI 架构的文艺复兴:用操作系统“内存管理”重构 LLM 状态机 —— 深度解密 Claude Code
  • Dialyxir 50+警告类型详解:每个警告的成因、示例与修复方法
  • EasyDeviceInfo高级用法:如何自定义配置和扩展功能
  • 使用 ChatGPT 修复 QNAP QuMagie 相册不显示照片的问题
  • Midjourney皮肤渲染进阶必修课:基于光学物理模型的8维质感参数对照表(含SSS散射系数、角质层透明度、皮下血红素映射值)
  • AI大模型不是硕士专属!普通人想转行?这4条高薪赛道任你选!
  • 大模型的伦理与合规:隐私保护、偏见与安全问题
  • 实战测试10款降AIGC平台:只选真正管用的那一款!
  • emacs-which-key核心功能深度解析:如何智能显示键绑定
  • 如何快速实现kagent与Istio、Cilium的完美集成:云原生AI代理部署终极指南
  • 2026年10款降AI率网站横评:最高AI率100%直降至0.12%
  • 《Windows Sysinternals实战指南》PsTools 学习笔记(7.3):远程 PsTools 连接排错全攻略
  • 2026年京东云OpenClaw/Hermes Agent配置Token Plan全步骤操作指南
  • 软考系统架构设计师实战论文集:自动驾驶与AI云端架构演进
  • Obsidian全功能日历:在笔记中打造你的专属时间管理系统
  • Wuthering Waves模组深度解析:高级功能实现与架构设计原理
  • gitstatus 与 Powerlevel10k 完美集成:打造终极终端体验
  • 软考高项案例分析9:项目采购管理
  • BetterCodable高级用法:自定义策略和属性包装器的深度解析
  • Python 3 简介
  • 【大模型12步学习路线 · 第12步 · ①原理篇】多模态 LLM + Multimodal RAG 全景:从 Qwen3-VL 到 ColPali / ColQwen2.5,让 LLM看懂Spec
  • Pandora.js与PM2对比分析:哪个更适合你的Node.js应用管理?
  • jor1k开发者指南:如何扩展自定义硬件设备模拟
  • CDCS金融算法挑战赛终极指南:甜橙金融与融360实战案例深度解析
  • 【2026必藏】6款智能降AIGC网站大曝光,一键秒降AI率至安全区!
  • 【深度解析】从 Antigravity 2.0 看 AI Agent 的产品化演进:动态子代理、项目工作区与多模型编排实战
  • DreamTalk多语言支持深度分析:从中文到德语的语音驱动生成
  • VirtualSMC安全特性解析:密钥保护、权限控制与数据加密的终极指南