当前位置: 首页 > news >正文

Ascend C uint8转half函数文档

asc_uint82half

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

头文件路径:"c_api/reg_compute/reg_convert.h"

将uint8_t类型数据转为half类型。

由于源操作数与目的操作数类型位宽比为1:2,读取数据时需要将一个VL大小的数据分为两部分,根据不同接口选取索引0或者索引1。

函数原型

// 数据读取索引为偶数的位置 __simd_callee__ inline void asc_uint82half(vector_half& dst, vector_uint8_t src, vector_bool mask) // 数据读取索引为奇数的位置 __simd_callee__ inline void asc_uint82half_v2(vector_half& dst, vector_uint8_t src, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器)。
src输入源操作数(矢量数据寄存器)。
mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

vector_uint8_t src; vector_half dst; vector_bool mask = asc_create_mask_b8(PAT_ALL); asc_loadalign(src, src_addr); // src_addr是外部输入的UB内存空间地址。 asc_uint82half(dst, src, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1129407/

相关文章:

  • 终极Gamdl技术架构深度解析:构建高效的Apple Music下载流水线
  • BTTV安卓版技术架构演进:从简单修改到完整模块化系统
  • 微信小程序食品安全管理系统:全链路设计与开发实战
  • JSON.simple容器工厂实战:ContainerFactory自定义Map和List容器
  • Swift开发者必看:Objective-C-RegEx-Categories桥接与使用指南
  • rawpy错误处理:全面解析LibRawError异常体系与调试技巧
  • todo[bot]测试策略:如何编写高质量的GitHub应用测试用例
  • Andromeda Web API详解:Canvas、Crypto与SQLite集成
  • 如何用离线OCR工具在3分钟内完成图片文字提取?
  • KMX63与PIC18LF25K40硬件协同与自然交互实现
  • DataMapper Core核心组件解析:Identity Map如何确保对象唯一性与内存优化
  • Instatic服务器资源规划:CPU、内存与存储需求终极指南
  • FXTest接口自动化测试平台:一站式Python+Flask接口测试解决方案
  • Sync配置详解:自定义目录监控、日志输出与桌面通知全攻略
  • SeaTunnel Web 任务调度与管理:如何高效管理海量数据同步任务
  • Teku贡献者指南:如何为开源以太坊共识客户端提交代码
  • Twitter API Client错误处理:10个常见问题与解决方案
  • Cargo-script 的未来发展:Rust 脚本生态系统的前景展望
  • STM32与IS31FL3731实现高效LED矩阵控制方案
  • 如何使用Adminer管理wordpress-nginx-docker数据库:安全高效的数据操作指南
  • FlagGems与FlagScale集成教程:构建企业级大模型训练平台
  • ENFUGUE TensorRT加速教程:如何让AI图像生成速度翻倍
  • 从CKAD认证到实际工作:Kubernetes应用开发技能迁移终极指南
  • 从零开始创建自定义登录页面:基于Awesome Login Pages的扩展教程
  • Summarize.site高级技巧:让AI摘要更符合你的阅读习惯
  • Awesome Login Pages贡献指南:如何为开源项目添加你的登录页面
  • Awesome Login Pages中的暗黑模式实现:完整代码解析
  • 如何通过专业Tracker列表解决动漫磁链下载难题?
  • Real-Time C++中断处理与并发编程:确保实时响应的关键技术 [特殊字符]
  • 如何配置Laguna XS 2.1的工具调用和推理控制参数