当前位置: 首页 > news >正文

华为CANN/asc-devkit:bfloat16平方根函数

hsqrt

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品x
Atlas A2 训练系列产品/Atlas A2 推理系列产品x
Atlas 200I/500 A2 推理产品x
Atlas 推理系列产品AI Corex
Atlas 推理系列产品Vector Corex
Atlas 训练系列产品x

功能说明

获取输入数据x的平方根。

函数原型

inline bfloat16_t hsqrt(bfloat16_t x)

参数说明

表 1参数说明

参数名输入/输出描述
x输入源操作数,输入数据。

返回值说明

输入数据的平方根。本接口受全局饱和模式影响,特殊值如下:

x值非饱和模式返回值饱和模式返回值
000
infinfASCRT_MAX_NORMAL_BF16
-infnan0
nannan0
小于0nan0

约束说明

本接口支持的输入数据范围为x大于等于0,否则返回值为nan。

需要包含的头文件

使用bfloat16_t类型接口需要包含"simt_api/asc_bf16.h"头文件。

#include "simt_api/asc_bf16.h"

调用示例

  • SIMT编程场景:

    __global__ __launch_bounds__(1024) void KernelSqrt(bfloat16_t* dst, bfloat16_t* x) { int idx = threadIdx.x + blockIdx.x * blockDim.x; dst[idx] = hsqrt(x[idx]); }
  • SIMD与SIMT混合编程场景:

    __simt_vf__ __launch_bounds__(1024) inline void KernelSqrt(__gm__ bfloat16_t* dst, __gm__ bfloat16_t* x) { int idx = threadIdx.x + blockIdx.x * blockDim.x; dst[idx] = hsqrt(x[idx]); }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/860860/

相关文章:

  • 深入解析AVRDUDESS:图形化AVR编程工具实战手册
  • 知识竞赛大屏计分方案:让比分一目了然
  • 深度解析:基于YOLOv8的AI辅助瞄准系统专业部署与优化指南
  • GLSL优化器中的代数优化与树重构技术深度解析:提升着色器性能的终极指南
  • CANN/asc-devkit SIMT Warp投票函数
  • Azure消息服务全面对比指南:Event Hubs、Service Bus、Event Grid应用场景解析
  • Squash架构深度剖析:从Plank到Debug Attachment的完整实现
  • BetterCodable快速入门指南:5分钟学会属性包装器的强大功能
  • 知识竞赛实时排名:平分怎么处理?
  • 初次使用 Taotoken 从注册到完成第一次 API 调用的全流程耗时与感受
  • PyTorch-FCN评估与可视化:掌握模型性能分析的核心方法
  • 为什么你的洛可可图总像“廉价壁纸”?揭秘3个隐藏权重陷阱(--stylize 600失效真相+--sref滥用警告)
  • Plexdrive开发者指南:如何贡献代码与扩展功能
  • Azure 数据库服务集成终极指南:Go语言快速连接MySQL、PostgreSQL与Cosmos DB开发实战
  • Medieval Fantasy City Generator 开发环境搭建:OpenFL + Haxe 完整教程
  • 知识竞赛电子计分板 vs 手工计分板:差距有多大
  • CANN/asc-devkit SIMT bfloat16数学函数
  • SPlisHSPlasH粘度模拟技术详解:从标准方法到最新算法
  • Redux Framework与Metaboxes完美整合:如何在文章和页面中添加自定义字段
  • AI 架构的文艺复兴:用操作系统“内存管理”重构 LLM 状态机 —— 深度解密 Claude Code
  • Dialyxir 50+警告类型详解:每个警告的成因、示例与修复方法
  • EasyDeviceInfo高级用法:如何自定义配置和扩展功能
  • 使用 ChatGPT 修复 QNAP QuMagie 相册不显示照片的问题
  • Midjourney皮肤渲染进阶必修课:基于光学物理模型的8维质感参数对照表(含SSS散射系数、角质层透明度、皮下血红素映射值)
  • AI大模型不是硕士专属!普通人想转行?这4条高薪赛道任你选!
  • 大模型的伦理与合规:隐私保护、偏见与安全问题
  • 实战测试10款降AIGC平台:只选真正管用的那一款!
  • emacs-which-key核心功能深度解析:如何智能显示键绑定
  • 如何快速实现kagent与Istio、Cilium的完美集成:云原生AI代理部署终极指南
  • 2026年10款降AI率网站横评:最高AI率100%直降至0.12%