当前位置: 首页 > news >正文

CANN/asc-devkit half类型精度转换函数

__float22half2_rn

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品x
Atlas A2 训练系列产品/Atlas A2 推理系列产品x
Atlas 200I/500 A2 推理产品x
Atlas 推理系列产品AI Corex
Atlas 推理系列产品Vector Corex
Atlas 训练系列产品x

功能说明

将float2类型数据遵循CAST_RINT模式转换为half2类型,返回转换后的half2类型数据。

函数原型

inline half2 __float22half2_rn(const float2 x)

参数说明

表 1参数说明

参数名输入/输出描述
x输入源操作数。

返回值说明

将输入的两个分量遵循CAST_RINT模式转换成的half2类型数据。

约束说明

需要包含的头文件

使用该接口需要包含"simt_api/asc_fp16.h"头文件。

#include "simt_api/asc_fp16.h"

调用示例

  • SIMT编程场景:

    // 使用短向量可提升数据搬运效率 __aicore__ void simt_float22half2_rn(float2* input, half2* output, uint32_t input_total_length) { uint32_t idx = blockIdx.x * blockDim.x + threadIdx.x; // 每个线程处理1个float2类型的数据,即2个float类型的数据,因此idx >= input_total_length / 2的线程不处理数据 if (idx >= input_total_length / 2) { return; } output[idx] = __float22half2_rn(input[idx]); } __global__ __launch_bounds__(1024) void cast_kernel(float* input, half* output, uint32_t input_total_length) { simt_float22half2_rn((float2*)input, (half2*)output, input_total_length); }
  • SIMD与SIMT混合编程场景:

    // 使用短向量可提升数据搬运效率 __simt_vf__ __launch_bounds__(1024) inline void simt_float22half2_rn(__gm__ float2* input, __gm__ half2* output, uint32_t input_total_length) { uint32_t idx = blockIdx.x * blockDim.x + threadIdx.x; // 每个线程处理1个float2类型的数据,即2个float类型的数据,因此idx >= input_total_length / 2的线程不处理数据 if (idx >= input_total_length / 2) { return; } output[idx] = __float22half2_rn(input[idx]); } __global__ __vector__ void cast_kernel(__gm__ float* input, __gm__ half* output, uint32_t input_total_length) { asc_vf_call<simt_float22half2_rn>(dim3(1024), (__gm__ float2*)input, (__gm__ half2*)output, input_total_length); }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/855837/

相关文章:

  • 别再手动敲命令了!用这个Shell脚本5分钟搞定Kerberos集群部署(附避坑指南)
  • 54、CAN总线共模扼流圈选型与滤波电路设计
  • PHP Intelephense与Composer依赖管理:提升PHP开发效率的终极指南
  • 如何在5分钟内安装BepInEx:游戏模组框架终极完整指南
  • 火绒弹窗总提示msedgewebview2联网?别慌,这是Office在线编辑在“敲门”
  • 2026年靠谱的大连电梯特种柔性电缆/起重设备特种柔性电缆精选推荐公司 - 品牌宣传支持者
  • 实战指南:利用Rufus创建Windows 11安装U盘并绕过硬件限制的完整方案
  • SpringBlade最佳实践完全清单:企业级开发规范
  • 别再只会用默认符号了!手把手教你用ArcGIS 10.8制作专业地形图点线面符号(附符号库文件)
  • TEAMMATES教育神器:免费在线同伴评估工具的完整指南
  • swagger-jsdoc 最佳实践:确保高质量 API 文档的 7 个技巧
  • Interstellar代码架构解析:Express.js与Bare服务器的完美结合
  • 保姆级教程:用ESP8266-01S和Blinker App,5分钟搞定手机远程开关灯(附完整代码)
  • CANN/asc-devkit AI Core注册接口
  • 如何用Sequin将Postgres变更实时流式传输到Kafka:完整指南 [特殊字符]
  • G-Helper实用指南:华硕笔记本性能调优与自动化管理配置模板
  • TeamPass角色权限管理终极指南:如何配置精细化的访问控制
  • 55、CAN总线差分信号线对滤波电容的布局策略
  • 精选六款免费学编程 APP 小白自学全程够用
  • CANN/cann-recipes-train:一站式平台快速启动RL训练示例
  • 如何用icloudpd轻松备份你的iCloud照片库:终极免费解决方案
  • 终极指南:在elm-react-native中使用react-native-blur和react-native-swiper实现高级UI效果 [特殊字符]
  • 游戏文件瘦身终极指南:使用tochd工具一键转换CHD格式
  • 专业级Lumia设备深度定制:Windows Phone Internals完整实战指南
  • Zygo沙盒环境配置:安全运行不受信任的脚本
  • CANN/asc-devkit SIMT-API反余弦函数
  • 从递归到数学规律:我是怎么把杨辉三角写对的
  • 如何在5分钟内搭建专业的电子实验室笔记本系统:eLabFTW完整指南
  • GitHub Desktop中文汉化神器:3分钟让你的Git操作界面说中文
  • 如何在5分钟内快速上手face-detection-tflite:Python轻量级人脸检测与虹膜追踪终极指南