当前位置: 首页 > news >正文

CANN/asc-devkit Where条件选择API

Where

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

x

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

x

功能说明

根据指定的条件,从两个源操作数中选择元素,生成目标操作数。两个源操作数均可以是LocalTensor或标量。

函数原型

template <typename T, typename U, typename S, typename V> __aicore__ inline void Where(const LocalTensor<T>& dst, const U& src0, const S& src1, const LocalTensor<V>& condition, const uint32_t count)

参数说明

表 1模板参数说明

参数名

描述

T

目的操作数数据类型。

Ascend 950PR/Ascend 950DT,支持的数据类型为:bool、int8_t、uint8_t、int16_t、uint16_t、half、bfloat16_t、int32_t、uint32_t、float、int64_t、uint64_t。

U

LocalTensor类型或标量类型。根据输入参数src0自动推导类型,开发者无需配置该参数,保证src0的数据类型与目的操作数保持一致即可。

S

LocalTensor类型或标量类型。根据输入参数src1自动推导类型,开发者无需配置该参数,保证src1的数据类型与目的操作数保持一致即可。

V

条件的数据类型,当前支持的数据类型为:bool。

表 2参数说明

参数名称

类型

说明

dst

输出

目的操作数。

类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。

src0、src1

输入

源操作数。类型为标量或LocalTensor,当类型为LocalTensor时,支持的TPosition为VECIN/VECCALC/VECOUT。

数据类型需要与目的操作数保持一致。

condition

输入

条件操作数。

类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。

count

输入

参与计算的元素个数。

返回值说明

约束说明

  • 不支持源操作数与目的操作数地址重叠。
  • 操作数地址偏移对齐要求请参见通用说明和约束。

调用示例

AscendC::LocalTensor<half> dst, src0, src1; AscendC::LocalTensor<bool> condition; uint32_t count = 512; AscendC::Where(dst, src0, src1, condition, count);

结果示例如下:

输入数据(src0): [1, 2, 3, ... 511, 512] 输入数据(src1): [-1, -2, -3, ... -511, -512] 条件输入数据(condition): [0, 1, 0, ... 0, 1] 输出数据(dst): [-1, 2, -3, ... -511, 512]

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/795873/

相关文章:

  • FanControl深度解析:5步打造Windows系统完美静音散热方案
  • CherryPy与数据库集成:SQLAlchemy和ORM模式详解
  • 为什么92%的AI团队在DP集成中失败?2026奇点大会披露4个致命反模式及对应生产级修复checklist
  • League-Toolkit终极指南:英雄联盟玩家的5大高效游戏辅助神器
  • csp信奥赛C++高频考点专项训练之字符串 --【字符串排序】:字符排序
  • 【信息科学与工程学】【数据科学】第四十九篇 Apache Hive 的函数0
  • FanControl终极指南:免费开源的Windows风扇智能控制软件
  • 终极Visual C++运行库修复指南:一劳永逸解决Windows软件兼容性问题
  • 在OpenClaw项目中集成Taotoken作为Agent模型供应商的实践
  • 3天搞定中文API大全:从菜鸟到高手的完整指南
  • 喜马拉雅音频下载技术重构:Go+Qt5混合架构的3大创新突破
  • S7-1200 PLC编程避坑指南:从振荡电路到浮点数计算,新手最容易犯的5个错误
  • 【审计专栏】招投标领域人工智能审计-01-算法的基础参数篇
  • 3步轻松实现AI智能图像分层:PSD自动生成终极指南
  • AI原生差分隐私落地难?2026奇点大会披露3类GPU加速噪声注入架构及TensorFlow/PyTorch原生适配代码
  • 告别本地安装!SAP顾问必看:手把手教你配置SICF并获取WEBGUI登录URL(含hosts文件修改)
  • 树状数组和线段树专题题解逆序对、区间异或、数线段差分、RMQ、最长连续交替子串、时间轴线段树
  • 终极FanControl中文使用指南:5分钟让你的Windows风扇控制更智能
  • m4s-converter终极指南:5秒解锁B站缓存视频,永久保存你的数字资产
  • 拆解OpenWrt的.ipk安装包:从文件结构到手动安装,彻底搞懂opkg底层逻辑
  • FanControl终极指南:如何在5分钟内解决Windows风扇控制难题
  • 告别会议室回音:用Python和WPE算法给你的语音识别模型做个‘降噪SPA’
  • 为什么Bebas Neue字体能成为设计师的终极免费选择?
  • QKeyMapper终极指南:免费实现键盘鼠标手柄全能映射的完整教程
  • 基于共识的捆绑算法(CBBA)的多智能体多任务分配问题——远程太空船交会和维修的 RPO 规划任务研究(Matlab代码实现)
  • 告别I2C的龟速:用STM32的SPI接口榨干ICM20948的性能(实测对比与配置优化)
  • Python基础 - 列表的创建 字面量与list函数的使用技巧
  • 从CANdb++到Matlab工作区:汽车工程师的DBC文件数据流转实战(以R2023b为例)
  • 终极ViGEmBus驱动指南:如何让Windows完美识别任何游戏控制器
  • C++ 左值和右值 —— 奇牛+Gemini