当前位置: 首页 > news >正文

CANN/asc-devkit:half2half_rz精度转换

__half2half_rz

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品x
Atlas A2 训练系列产品/Atlas A2 推理系列产品x
Atlas 200I/500 A2 推理产品x
Atlas 推理系列产品AI Corex
Atlas 推理系列产品Vector Corex
Atlas 训练系列产品x

功能说明

将half类型数据遵循CAST_TRUNC模式取整。

函数原型

inline float __half2half_rz(const half x)

参数说明

表 1参数说明

参数名输入/输出描述
x输入源操作数。

返回值说明

输入遵循CAST_TRUNC模式取整后的half类型数据。

约束说明

需要包含的头文件

使用该接口需要包含"simt_api/asc_fp16.h"头文件。

#include "simt_api/asc_fp16.h"

调用示例

  • SIMT编程场景:

    __global__ __launch_bounds__(1024) void kernel__half2half_rz(half* dst, half* x) { int idx = threadIdx.x + blockIdx.x * blockDim.x; dst[idx] = __half2half_rz(x[idx]); }
  • SIMD与SIMT混合编程场景:

    __simt_vf__ __launch_bounds__(1024) inline void kernel__half2half_rz(__gm__ half* dst, __gm__ half* x) { int idx = threadIdx.x + blockIdx.x * blockDim.x; dst[idx] = __half2half_rz(x[idx]); }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/855898/

相关文章:

  • 用P4和BMv2在Ubuntu上快速搭建一个可编程三层交换机(附完整代码和避坑指南)
  • 镀锌线槽现货推荐:2026靠谱热浸锌线槽/PVC线槽/母线槽定制厂家推荐指南 - 栗子测评
  • 如何用Sunshine打造家庭游戏云:免费开源的游戏串流终极指南
  • RK3568实战:交叉编译FFmpeg时遇到的‘unknown mnemonic’错误,我是这样解决的
  • 2026年知名的三亚别墅庭院设计施工装修/三亚自建房设计装修/三亚全案设计施工装修品牌公司推荐 - 品牌宣传支持者
  • 面试官视角:我为什么总爱问C语言static、volatile和extern?
  • 如何高效获得GitHub社区认可:开发者的3个实用徽章获取策略
  • AI的核心是算力,算力的核心是Token,那么Token到底是什么?
  • CANN/asc-devkit动态编译静态标志
  • GB/T14710有源设备环境及运输经验总结及怎样避免被的发补
  • ComfyUI图像增强工具终极指南:5大优势快速上手AI语义分割模块
  • 哪些因素会影响论文的重复率?
  • bezier-easing高级用法:自定义缓动曲线与复杂动画场景终极指南
  • OmniSharp-vim与fzf、vim-clap深度集成:提升C开发效率的7个关键点
  • 实战揭秘:Obsidian加州海岸主题如何将macOS美学融入笔记生产力革命
  • 2026年评价高的三亚海棠湾别墅设计装修/三亚全案设计施工装修/三亚豪宅设计装修/三亚自建房设计装修综合评价公司 - 行业平台推荐
  • 微博相册批量下载终极指南:3步轻松收藏所有高清图片
  • AI嵌入式系统测试:融合经典方法与数据驱动验证的工程实践
  • BetterCodable中的@LossyArray和@LossyDictionary:如何优雅处理API中的无效数据
  • 天文科研提速关键突破:Perplexity多模态搜索如何秒级定位哈勃原始FITS文件(含ASTROQUERY兼容配置)
  • OptScale 实战教程:检测和清理未使用的云资源
  • 如何使用 cargo audit 检查 Rust 项目依赖漏洞安全
  • CANN Ascend C浮点转整型函数
  • SysDVR项目架构深度剖析:系统模块、配置工具和客户端的协同工作
  • 2026年靠谱的不锈钢清洗设备/洗烘玻璃清洗设备源头工厂推荐 - 品牌宣传支持者
  • YetiForceCRM高级定制技巧:10个方法让CRM完全适配你的业务
  • 深度解析Clarity AI超分辨率架构:从算法原理到实战优化指南
  • 2026年屋面装饰欧式发泡陶瓷构件/发泡陶瓷窗套线条源头工厂推荐 - 行业平台推荐
  • 世界经济论坛2026警告:AI攻防战打响,网络安全正面临“贫富分化”
  • GGCNN机器人抓取预测:从零开始掌握实时抓取合成技术