当前位置: 首页 > news >正文

CANN/asc-devkit向量大于标量比较函数

asc_gt_scalar

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

对源操作数执行逐元素比较。对于src0_i > value,若条件成立则目的操作数对应结果位为1,否则为0,每个元素的比较结果占一个bit。

函数原型

__simd_callee__ inline void asc_gt_scalar(vector_bool& dst, vector_uint8_t src, uint8_t value, vector_bool mask) __simd_callee__ inline void asc_gt_scalar(vector_bool& dst, vector_int8_t src, int8_t value, vector_bool mask) __simd_callee__ inline void asc_gt_scalar(vector_bool& dst, vector_bfloat16_t src, bfloat16_t value, vector_bool mask) __simd_callee__ inline void asc_gt_scalar(vector_bool& dst, vector_uint16_t src, uint16_t value, vector_bool mask) __simd_callee__ inline void asc_gt_scalar(vector_bool& dst, vector_int16_t src, int16_t value, vector_bool mask) __simd_callee__ inline void asc_gt_scalar(vector_bool& dst, vector_uint32_t src, uint32_t value, vector_bool mask) __simd_callee__ inline void asc_gt_scalar(vector_bool& dst, vector_int32_t src, int32_t value, vector_bool mask) __simd_callee__ inline void asc_gt_scalar(vector_bool& dst, vector_half src, half value, vector_bool mask) __simd_callee__ inline void asc_gt_scalar(vector_bool& dst, vector_float src, float value, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(掩码寄存器)。
src输入源操作数(矢量数据寄存器)。
value输入源操作数(标量)。
mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

vector_bool dst; vector_half src; half value = 1.0; vector_bool mask = asc_create_mask_b16(PAT_ALL); asc_loadalign(src, src_addr); // src_addr是外部输入的UB内存空间地址。 asc_gt_scalar(dst, src, value, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1045205/

相关文章:

  • 团队博客 4:Sprint 2——功能扩展与深化
  • Terrakube自定义工作流:如何集成OPA、Infracost等工具扩展IaC能力
  • 3分钟掌握微信语音转换:Silk v3解码器完整使用指南
  • CANN/Ascend C数据块最小规约函数
  • 2026年宁波GEO获客优化服务商盘点:本土实力阵营解析 - 起跑123
  • Roo Code Memory Bank终极指南:让AI助手记住你的项目上下文
  • VAC进程监控模块完全解析:3种扫描类型与虚拟方法表技术揭秘
  • MC68F375 QSMCM模块深度解析:从寄存器配置到队列SPI实战
  • 团队博客 5:Sprint 3——收官与优化
  • 信任的进化:技术实现详解——如何用JavaScript构建博弈论模拟器
  • 从0到1搭建图像采集流程:pic-gather快速上手指南
  • 2026年宁波GEO获客优化服务商调研与合规推荐 - 起跑123
  • 为什么麦克斯韦方程组如此重要?Intuitive-Guide-to-Maxwells-Equations揭示电磁学的奥秘
  • Paralayout快速开始:5种安装方法让你轻松集成iOS布局工具
  • 5个高效管理远程服务器的实用技巧:使用Viking提升运维效率
  • 3秒极速观影:Jav-Play浏览器扩展终极指南
  • 10分钟完成黑苹果配置:OpCore Simplify终极图形化工具完全指南
  • 枚举类三大应用场景 - -z-w-h
  • 如何安装和配置Google Translate Mac客户端:5分钟快速上手教程 [特殊字符]
  • 终极指南:用YOLOv9快速构建高性能目标检测系统
  • 从零到一:Docker化Magento开发环境的革命性实践
  • 3步解锁免费LLM API宝藏:开发者必知的终极资源指南
  • express-winston性能优化:减少日志开销的7个最佳实践
  • 2026苏州防水补漏维修团队实测盘点TOP4:苏州业主房屋渗漏修缮靠谱选择 - 宅安选房屋修缮
  • winget只下载不安装
  • WebView控制完全掌握:JSBrowser中前进/后退/刷新功能的实现方法
  • 形式化方法 +《大象 Thinking in UML》 - -z-w-h
  • 5步掌握DiT扩散模型:基于Transformer的图像生成终极指南
  • verb快速上手:5步学会创建第一个NURBS曲线和曲面
  • GEO获客优化推广与传统SEO、短视频搜索的差异化体验解析 - 起跑123