当前位置: 首页 > news >正文

CANN/asc-devkit SIMD矢量标量比较API

asc_lt_scalar

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

lt(less than),对源操作数执行逐元素比较。对于src_i < value,若条件成立则目的操作数对应结果位为1,否则为0,每个元素的比较结果占一个bit。

函数原型

__simd_callee__ inline void asc_lt_scalar(vector_bool& dst, vector_uint8_t src, uint8_t value, vector_bool mask) __simd_callee__ inline void asc_lt_scalar(vector_bool& dst, vector_int8_t src, int8_t value, vector_bool mask) __simd_callee__ inline void asc_lt_scalar(vector_bool& dst, vector_half src, half value, vector_bool mask) __simd_callee__ inline void asc_lt_scalar(vector_bool& dst, vector_uint16_t src, uint16_t value, vector_bool mask) __simd_callee__ inline void asc_lt_scalar(vector_bool& dst, vector_int16_t src, int16_t value, vector_bool mask) __simd_callee__ inline void asc_lt_scalar(vector_bool& dst, vector_bfloat16_t src, bfloat16_t value, vector_bool mask) __simd_callee__ inline void asc_lt_scalar(vector_bool& dst, vector_float src, float value, vector_bool mask) __simd_callee__ inline void asc_lt_scalar(vector_bool& dst, vector_uint32_t src, uint32_t value, vector_bool mask) __simd_callee__ inline void asc_lt_scalar(vector_bool& dst, vector_int32_t src, int32_t value, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器)。
src输入源操作数(矢量数据寄存器)。
value输入源操作数(标量)。
mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

vector_bool dst; vector_half src0; half value = 0.0; vector_bool mask = asc_create_mask_b16(PAT_ALL); asc_loadalign(src0, src0_addr); // src0_addr是外部输入的UB内存空间地址。 asc_lt_scalar(dst, src0, value, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1045151/

相关文章:

  • 方法耗时计算 + 匿名内部类 - -z-w-h
  • 如何在Spotcast中实现播客自动播放?最新功能全解析
  • h264_analyze工具使用指南:轻松调试H.264视频文件的实用技巧
  • StyleGAN在GenForce中的实现原理:从理论到代码的完整解析
  • ComfyUI-KJNodes:5步掌握AI工作流效率跃升的核心技术
  • 如何安装BlockParty广告拦截器?iOS与macOS平台的快速上手教程
  • DeepLabCut入门指南:5步快速掌握无标记动物姿态估计技术 [特殊字符]
  • 3步解决DeepSeek-V4模型在Atlas A2/A3硬件部署难题:AMCT量化转换实战指南
  • 解决Express.js日志难题:express-winston实战案例分析 [特殊字符]
  • CANN/asc-devkit SIMD bfloat16转fp4x2函数
  • 从零极点分布到系统行为:频率响应与稳定性的直观解析
  • 为什么LocateAnything-3B能成为视觉定位的终极解决方案:实战技巧与完整指南
  • Markoff社区与支持:获取帮助与分享使用经验
  • grunt-concurrent高级配置指南:limit、logConcurrentOutput、indent参数详解
  • TPM架构探秘(三):从可信根到主动免疫——TPM 2.0架构下的可信平台构建实践
  • 为什么选择vscode-remote-try-node?Node.js开发容器的10大优势与实际应用案例
  • Git状态可视化:深入解析Nicolas Gallagher dotfiles的bash提示符系统
  • Klipper 3D打印机固件终极指南:5个高级技巧解决打印质量难题
  • TestPilot:AI驱动测试生成的终极革命,如何让JavaScript/TypeScript测试自动化达到新高度?
  • 如何高效运用图数据库:3个核心技巧实战指南
  • LingChat多角色剧本系统:导入自定义剧情与场景的完整指南
  • LoRA技术解析:低秩适应原理与权重空间应用
  • CANN/asc-devkit:asc_lt_scalar矢量标量比较函数
  • GuangxiAICC/swinv2-tiny-patch4-window16-256模型配置详解:从patch_size到window_size的参数调优
  • 3大突破性设计重塑抖音内容生态管理体验
  • 2026年宁波GEO获客优化服务商调研:合规运营成核心 - 起跑123
  • xiaozhi-esp32:基于MCP协议的ESP32 AI聊天机器人技术解析
  • MC68F375 CTM9定时器DASM与PWMSM模块深度解析与实战指南
  • FaceFusion 3.6.0终极实战:5大策略实现影视级人脸融合效果
  • 内容驱动型网站必看:indie-hacker-tools-plus推荐的Next.js、Hono与Astro框架选型指南