当前位置: 首页 > news >正文

CANN/asc-devkit int8转half API文档

asc_int82half

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

将int8_t类型数据转换为half类型。

函数原型

  • 前n个数据计算

    __aicore__ inline void asc_int82half(__ubuf__ half* dst, __ubuf__ int8_t* src, uint32_t count)
  • 高维切分计算

    __aicore__ inline void asc_int82half(__ubuf__ half* dst, __ubuf__ int8_t* src, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint16_t src_repeat_stride)
  • 同步计算

    __aicore__ inline void asc_int82half_sync(__ubuf__ half* dst, __ubuf__ int8_t* src, uint32_t count)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量)的起始地址。
src输入源操作数(矢量)的起始地址。
count输入参与计算的元素个数。
repeat输入迭代次数。
dst_block_stride输入目的操作数单次迭代内不同DataBlock间地址步长。
src_block_stride输入源操作数单次迭代内不同DataBlock间地址步长。
dst_repeat_stride输入目的操作数相邻迭代间相同DataBlock的地址步长。
src_repeat_stride输入源操作数相邻迭代间相同DataBlock的地址步长。

返回值说明

流水类型

PIPE_V

约束说明

  • dst、src的起始地址需要32字节对齐。
  • 操作数地址重叠约束请参考通用地址重叠约束。

调用示例

constexpr uint64_t total_length = 128; // total_length指参与计算的数据长度 __ubuf__ int8_t src[total_length]; __ubuf__ half dst[total_length]; asc_int82half(dst, src, total_length); // 将src转换为half类型并存放到dst中

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/862375/

相关文章:

  • 2026年05月智慧泵房优选:口碑与实力并存的公司,供水控制柜/光伏太阳能供水设备/长轴消防泵,智慧泵房制造厂家推荐 - 品牌推荐师
  • 智慧树刷课插件:3个功能让你告别手动操作,节省50%学习时间
  • 保姆级教程:用Conda为Stable Diffusion WebUI创建纯净Python环境,彻底告别启动崩溃
  • DeepCreamPy图像修复终极指南:AI智能去码快速上手教程
  • 告别Transformer卡顿!用SegMamba在3D医学图像分割上实现又快又准(附BraTS2023实战代码)
  • Airflow Maintenance Dags项目架构深度剖析:从代码实现到生产部署
  • 2026年比较好的5G数据采集网关/深圳边缘计算数据采集网关/定位和锁机远程运维网关/深圳5G数据采集网关用户好评公司 - 品牌宣传支持者
  • NotaGen终极指南:基于大语言模型的高质量古典乐谱生成解决方案
  • 从手机摄像头到天文望远镜:一文搞懂CCD传感器是如何‘看见’世界的
  • windows8080端口被占用 ?
  • AD7616前端设计避坑指南:RCR滤波器如何影响谐波测量精度?从硬件到软件的补偿思路
  • 数字电路-74LS148的5路呼叫显示和74LS373的8路抢答器
  • CANN/pypto张量创建指南
  • Musicn安全使用指南:避免版权风险的最佳实践
  • 2026年推荐哈尔滨铜门公司选择指南 - 品牌宣传支持者
  • Windows 7 SP2终极解决方案:三步告别硬件兼容性问题,让经典系统焕发新生
  • Gemini赋能安全工程师:自动生成PoC脚本的技术实践
  • GitHub Desktop中文汉化终极指南:5分钟让英文界面变中文
  • Sixpack Redis数据存储策略:高效管理A/B测试数据的10个技巧
  • Mainframer错误排查指南:常见问题及解决方法大全
  • YOLO V8-Detection 【批量图片推理】 推理详解及部署实现
  • 2026年口碑好的售后服务远程运维网关/边缘计算数据采集网关/深圳无线数据采集网关/深圳4G数据采集网关品牌公司推荐 - 行业平台推荐
  • CANN/asc-devkit:asc_prelu函数文档
  • RISC-V异构计算中任务卸载优化与多播技术实践
  • 终极指南:如何在普通电脑上免费运行大型语言模型?BitNet 1-bit量化技术解密
  • CANN/pypto 框架问题诊断
  • “大理石纹理模糊”不是算力问题!Midjourney材质分辨率陷阱:采样步数×tile参数×--zoom的隐性冲突公式(实测提升清晰度320%)
  • 如何扩展TwicketSegmentedControl:自定义布局与动画效果
  • 如何在10分钟内掌握WiX Toolset:Windows安装包制作终极指南
  • 微信小程序二维码生成实战指南:weapp-qrcode高效解决方案