当前位置: 首页 > news >正文

昇腾C解交织API文档

DeInterleave

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

x

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

x

Atlas 200I/500 A2 推理产品

x

Atlas 推理系列产品 AI Core

x

Atlas 推理系列产品 Vector Core

x

Atlas 训练系列产品

x

功能说明

给定源操作数src0和src1,将src0和src1中的元素解交织存入结果操作数dst0和dst1中。解交织排列方式如下图所示,其中每个方格代表一个元素。

函数原型

  • 两个输入

    template <typename T> __aicore__ inline void DeInterleave(const LocalTensor<T>& dst0, const LocalTensor<T>& dst1, const LocalTensor<T>& src0, const LocalTensor<T>& src1, const int32_t count)
  • 一个输入

    template <typename T> __aicore__ inline void DeInterleave(const LocalTensor<T>& dst0, const LocalTensor<T>& dst1, const LocalTensor<T>& src, const int32_t srcCount)

参数说明

表 1模板参数说明

参数名

描述

T

操作数数据类型。

表 2参数说明

参数名

输入/输出

描述

dst0/dst1

输出

目的操作数。

类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。

LocalTensor的起始地址需要32字节对齐。

Ascend 950PR/Ascend 950DT,支持的数据类型为:uint8_t/int8_t/uint16_t/int16_t/half/bfloat16_t/uint32_t/int32_t/float/uint64_t/int64_t

src/src0/src1

输入

源操作数。

类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。

LocalTensor的起始地址需要32字节对齐。

源操作数的数据类型需要与目的操作数保持一致。

Ascend 950PR/Ascend 950DT,支持的数据类型为:uint8_t/int8_t/uint16_t/int16_t/half/bfloat16_t/uint32_t/int32_t/float/uint64_t/int64_t

count

输入

输入/输出数据元素个数,dst0/dst1/src0/src1长度大小为count。count必须为偶数。

srcCount

输入

输入数据元素个数,两个输出的大小都为输入的一半。srcCount必须为偶数。

返回值说明

约束说明

调用示例

本样例中只展示Compute流程中的部分代码。

  • 两个输入

    AscendC::DeInterleave(dst0Local, dst1Local, src0Local, src1Local, 512);

    结果示例如下:

    输入数据src0Local: [1 2 3 ... 512] 输入数据src1Local: [513 514 515 ... 1024] 输出数据dst0Local: [1 3 5 ... 1023] 输出数据dst1Local: [2 4 6 ... 1024]
  • 一个输入

    AscendC::DeInterleave(dst0Local, dst1Local, srcLocal, 512);

    结果示例如下:

    输入数据srcLocal: [1 2 3 ... 512] 输出数据dst0Local: [1 3 5 ... 511] 输出数据dst1Local: [2 4 6 ... 512]

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/853231/

相关文章:

  • G-Helper完整指南:3分钟掌握华硕笔记本性能优化神器
  • CANN/catlass LayoutTag(旧版Layout)
  • 靠谱的远程手机控制软件 远程控制手机推荐用无界趣连2.0
  • CANN/.gitcode缺陷报告模板深度解析:如何高效提交昇腾AI问题反馈
  • RV1126B嵌入式OCR实战:CTPN+CRNN模型部署与优化全解析
  • YOLO-ONNX-Java 模型评估指标完全指南:从理论到实践
  • 3大AI创作效率瓶颈的模块化解法:ComfyUI企业级工作流自动化实践
  • Onyx Core API完全手册:RESTful接口详解与实战案例
  • Serverless-Devs插件开发教程:如何扩展工具的核心功能
  • ncmdump终极指南:5分钟解锁网易云音乐NCM加密文件
  • 程序员学习指南【非常详细】|零基础入门到精通
  • 用C语言刷PTA数据结构题:我是如何把链表合并和哈希表删除函数写到面试官满意的
  • 深圳市火灵鸟技术有限公司深度解析:从国产芯到全景可视化,一家执法装备企业的成长路径 - 品牌优选官
  • Wolverine性能优化终极秘籍:从基础配置到高级调优
  • Windows风扇控制实战:3种场景下的智能散热解决方案
  • Linux/Win双平台实战:MinIO安装后第一件事,如何正确设置并牢记你的ROOT密码?
  • 手把手教你为展锐平台新摄像头(如OV08A10)添加驱动:Sensor配置与AF驱动集成详解
  • Intel 14代酷睿接口更迭:技术推演与用户决策指南
  • Kilim Actor模型实践:构建高并发消息传递系统的终极指南 [特殊字符]
  • ArcGIS Pro 3.x 批量处理遥感栅格:用Python脚本实现自动化转点、计算与导出(附完整代码)
  • 调试与性能分析:Ascend TensorFlow Adapter常见问题解决方案
  • CANN/asnumpy-docs 架构设计
  • Kafka-UI:3分钟快速上手,轻松管理你的Apache Kafka集群
  • ESP32任务阻塞导致看门狗报错?手把手教你用menuconfig调整超时时间
  • 浏览器资源嗅探扩展架构:基于网络请求拦截的流媒体下载技术方案
  • MATLAB图像处理实战:用RGB、HSV、YCbCr模型给照片换个风格(附完整代码)
  • WorkBuddy帮我优化服务器JVM,GC频率提升了1000倍,程序员离失业还有多远
  • 日常吃香蕉的实用功效:从三餐到应急的场景解读 - 奔跑123
  • CANN/asc-devkit:Transpose数据转换API文档
  • JSBSim性能优化:多线程、实时仿真与内存管理技巧