当前位置: 首页 > news >正文

CANN/asc-devkit float2到half2向上取整转换函数

__float22half2_ru

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品x
Atlas A2 训练系列产品/Atlas A2 推理系列产品x
Atlas 200I/500 A2 推理产品x
Atlas 推理系列产品AI Corex
Atlas 推理系列产品Vector Corex
Atlas 训练系列产品x

功能说明

将float2类型数据的两个分量遵循CAST_CEIL模式转换为半精度浮点数,返回转换后的half2类型数据。

函数原型

inline half2 __float22half2_ru(const float2 x)

参数说明

表 1参数说明

参数名输入/输出描述
x输入源操作数。

返回值说明

将输入的两个分量遵循CAST_CEIL模式转换成的half2类型数据。

约束说明

需要包含的头文件

使用该接口需要包含"simt_api/asc_fp16.h"头文件。

#include "simt_api/asc_fp16.h"

调用示例

  • SIMT编程场景:

    // 使用短向量可提升数据搬运效率 __aicore__ void simt_float22half2_ru(float2* input, half2* output, uint32_t input_total_length) { uint32_t idx = blockIdx.x * blockDim.x + threadIdx.x; // 每个线程处理1个float2类型的数据,即2个float类型的数据,因此idx >= input_total_length / 2的线程不处理数据 if (idx >= input_total_length / 2) { return; } output[idx] = __float22half2_ru(input[idx]); } __global__ __launch_bounds__(1024) void cast_kernel(float* input, half* output, uint32_t input_total_length) { asc_vf_call<simt_float22half2_ru>(dim3(1024), (float2*)input, (half2*)output, input_total_length); }
  • SIMD与SIMT混合编程场景:

    // 使用短向量可提升数据搬运效率 __simt_vf__ __launch_bounds__(1024) inline void simt_float22half2_ru(__gm__ float2* input, __gm__ half2* output, uint32_t input_total_length) { uint32_t idx = blockIdx.x * blockDim.x + threadIdx.x; // 每个线程处理1个float2类型的数据,即2个float类型的数据,因此idx >= input_total_length / 2的线程不处理数据 if (idx >= input_total_length / 2) { return; } output[idx] = __float22half2_ru(input[idx]); } __global__ __vector__ void cast_kernel(__gm__ float* input, __gm__ half* output, uint32_t input_total_length) { asc_vf_call<simt_float22half2_ru>(dim3(1024), (__gm__ float2*)input, (__gm__ half2*)output, input_total_length); }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/855903/

相关文章:

  • 2026铝合金桥架定制哪家强?不锈钢桥架定制厂家源头直销,一站式服务 - 栗子测评
  • 终极指南:5分钟实现直播实时操作可视化
  • MATLAB强化学习实战:用DDPG和TD3教Biped机器人走路,哪个更稳?
  • Python Tkinter + 多线程:手把手教你做个不卡顿的TXT文本去重小工具(附完整源码)
  • CANN/asc-devkit:half2half_rz精度转换
  • 用P4和BMv2在Ubuntu上快速搭建一个可编程三层交换机(附完整代码和避坑指南)
  • 镀锌线槽现货推荐:2026靠谱热浸锌线槽/PVC线槽/母线槽定制厂家推荐指南 - 栗子测评
  • 如何用Sunshine打造家庭游戏云:免费开源的游戏串流终极指南
  • RK3568实战:交叉编译FFmpeg时遇到的‘unknown mnemonic’错误,我是这样解决的
  • 2026年知名的三亚别墅庭院设计施工装修/三亚自建房设计装修/三亚全案设计施工装修品牌公司推荐 - 品牌宣传支持者
  • 面试官视角:我为什么总爱问C语言static、volatile和extern?
  • 如何高效获得GitHub社区认可:开发者的3个实用徽章获取策略
  • AI的核心是算力,算力的核心是Token,那么Token到底是什么?
  • CANN/asc-devkit动态编译静态标志
  • GB/T14710有源设备环境及运输经验总结及怎样避免被的发补
  • ComfyUI图像增强工具终极指南:5大优势快速上手AI语义分割模块
  • 哪些因素会影响论文的重复率?
  • bezier-easing高级用法:自定义缓动曲线与复杂动画场景终极指南
  • OmniSharp-vim与fzf、vim-clap深度集成:提升C开发效率的7个关键点
  • 实战揭秘:Obsidian加州海岸主题如何将macOS美学融入笔记生产力革命
  • 2026年评价高的三亚海棠湾别墅设计装修/三亚全案设计施工装修/三亚豪宅设计装修/三亚自建房设计装修综合评价公司 - 行业平台推荐
  • 微博相册批量下载终极指南:3步轻松收藏所有高清图片
  • AI嵌入式系统测试:融合经典方法与数据驱动验证的工程实践
  • BetterCodable中的@LossyArray和@LossyDictionary:如何优雅处理API中的无效数据
  • 天文科研提速关键突破:Perplexity多模态搜索如何秒级定位哈勃原始FITS文件(含ASTROQUERY兼容配置)
  • OptScale 实战教程:检测和清理未使用的云资源
  • 如何使用 cargo audit 检查 Rust 项目依赖漏洞安全
  • CANN Ascend C浮点转整型函数
  • SysDVR项目架构深度剖析:系统模块、配置工具和客户端的协同工作
  • 2026年靠谱的不锈钢清洗设备/洗烘玻璃清洗设备源头工厂推荐 - 品牌宣传支持者