当前位置: 首页 > news >正文

CANN/asc-devkit向量标量比较API

asc_gt_scalar

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

src中的每个元素逐个与标量value比较大小,如果某个位置上的元素大于value,则输出结果dst上的对应比特位为1,否则为0。

函数原型

  • 高维切分计算

    __aicore__ inline void asc_gt_scalar(__ubuf__ uint8_t* dst, __ubuf__ half* src, half value, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint8_t src_repeat_stride) __aicore__ inline void asc_gt_scalar(__ubuf__ uint8_t* dst, __ubuf__ float* src, float value, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint8_t src_repeat_stride)
  • 同步计算

    __aicore__ inline void asc_gt_scalar_sync(__ubuf__ uint8_t* dst, __ubuf__ half* src, half value, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint8_t src_repeat_stride) __aicore__ inline void asc_gt_scalar_sync(__ubuf__ uint8_t* dst, __ubuf__ float* src, float value, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint8_t src_repeat_stride)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量)的起始地址。
src输入源操作数(矢量)的起始地址。
value输入源操作数(标量)。
repeat输入迭代次数。
dst_block_stride输入目的操作数单次迭代内不同DataBlock间地址步长。
src_block_stride输入源操作数单次迭代内不同DataBlock间地址步长。
dst_repeat_stride输入目的操作数相邻迭代间相同DataBlock的地址步长。
src_repeat_stride输入源操作数相邻迭代间相同DataBlock的地址步长。

返回值说明

流水类型

PIPE_V

约束说明

  • 操作数地址重叠约束请参考通用地址重叠约束。
  • dst、src的起始地址需要32字节对齐。
  • dst按照小端顺序排序成二进制结果,对应src中相应位置的数据比较结果。
  • 当结果输出到目的地址中时,mask参数不生效。

调用示例

// 结果输出到目标地址中,固定为128个元素 constexpr uint32_t total_length = 128; __ubuf__ uint8_t dst[total_length / 8]; __ubuf__ half src[total_length]; half scalar = 20; uint8_t repeat = 1; uint8_t dst_block_stride = 1; uint8_t src_block_stride = 1; uint8_t dst_repeat_stride = 8; uint8_t src_repeat_stride = 8; …… // 数据搬运及同步操作 asc_gt_scalar(dst, src, scalar, repeat, dst_block_stride, src_block_stride, dst_repeat_stride, src_repeat_stride); …… // 同步操作

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/796045/

相关文章:

  • 微服务测试的终极难题:分布式链路追踪与AI根因分析实战
  • Webcamoid:60+特效让普通摄像头变身高能创意工具
  • 终极指南:Windows虚拟手柄驱动ViGEmBus - 让任何手柄在PC上完美运行 [特殊字符]
  • 告别Jtag!手把手教你将ZYNQ PL端LED程序烧写到QSPI Flash自启动
  • Remotion 渲染视频脚本 ,自动化编辑视频 Node.js 层面是“单线程 JS”,但在实际渲染时是“高度并行”的。
  • SharpShooter AMSI绕过技术深度解析:如何有效规避Windows防御机制
  • Jenkins Job DSL与Pipeline集成:现代DevOps工作流的10个最佳实践
  • 44.React 里的 Synthetic Events(合成事件)是什么?
  • 3大策略:如何用Inter字体优化方案提升网站性能300%
  • COSMIC Text入门指南:如何在Rust中实现多语言文本渲染
  • OpenClaw赚钱实录:从“养龙虾“到可持续变现的实践指南——OpenClaw一人公司-[一人公司的终极技术栈,从0到变现的完整光谱]
  • 昇腾GE动态AIPP通道最小值设置
  • 2026年西安画册印刷厂深度横评:从源头工厂直达高品质交付的完整指南 - 优质企业观察收录
  • FanControl终极指南:3步搞定Windows风扇智能控制
  • 【信息科学与工程学】【解决方案体系】第三十三篇 直播领域产品及业务模型10 直播与点播系统01
  • CANN/ops-math方差计算算子
  • 如何在3分钟内将Chrome变成强大的Markdown阅读器?markdownReader插件强力指南
  • 11.从0到1构建产品信息模块:一线开发视角的数据库设计全流程拆解
  • 如何用XUnity.AutoTranslator打破语言障碍:Unity游戏翻译终极解决方案
  • 如何优雅地抽离出数据库的共同特点
  • FanControl深度解析:智能散热管理系统的技术实现与最佳实践
  • 定制你的弹窗外观:WYPopoverController主题设置与颜色方案全攻略
  • 2026上海中考复读学校实力排行榜,绿地中复稳居优选前列 - damaigeo
  • docker-maven-plugin 与CI/CD集成:自动化构建和部署的完整流程
  • Xbox存档提取终极指南:3分钟实现跨平台游戏进度迁移
  • 如何用HS2-HF_Patch一键解锁Honey Select 2完整游戏体验
  • GTA5线上小助手:终极免费工具完整使用教程
  • 5分钟修复Windows软件启动故障:VisualCppRedist AIO运行库一站式解决方案
  • 从文件头到解压器:全面解析ZIP/RAR伪加密的识别与破解
  • 泸州全城黄金回收服务白皮书——六大正规品牌资质背景与酒城全域覆盖网络 - 金掌柜黄金回收