当前位置: 首页 > news >正文

CANN向量比较函数asc_ge_scalar

asc_ge_scalar

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

按元素判断src >= value是否成立,若成立则输出结果为1,否则为0。每个元素的比较结果占1个bit。

函数原型

  • 高维切分计算

    __aicore__ inline void asc_ge_scalar(__ubuf__ uint8_t* dst, __ubuf__ half* src, half value, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint16_t src_repeat_stride) __aicore__ inline void asc_ge_scalar(__ubuf__ uint8_t* dst, __ubuf__ float* src, float value, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint16_t src_repeat_stride)
  • 同步计算

    __aicore__ inline void asc_ge_scalar_sync(__ubuf__ uint8_t* dst, __ubuf__ half* src, half value, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint16_t src_repeat_stride) __aicore__ inline void asc_ge_scalar_sync(__ubuf__ uint8_t* dst, __ubuf__ float* src, float value, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint16_t src_repeat_stride)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量)的起始地址。
src输入源操作数(矢量)的起始地址。
value输入源操作数(标量)的起始地址。
repeat输入迭代次数。
dst_block_stride输入目的操作数单次迭代内不同DataBlock间地址步长。
src_block_stride输入源操作数单次迭代内不同DataBlock间地址步长。
dst_repeat_stride输入目的操作数相邻迭代间相同DataBlock的地址步长。
src_repeat_stride输入源操作数相邻迭代间相同DataBlock的地址步长。

返回值说明

流水类型

PIPE_V

约束说明

  • 操作数地址重叠约束请参考通用地址重叠约束。
  • dst、src的起始地址需要32字节对齐。
  • dst按照小端顺序排序成二进制结果,对应src中相应位置的数据比较结果。
  • 当结果输出到目的地址中时,mask参数不生效。

调用示例

// 结果输出到目标地址中,固定为128个元素 constexpr uint32_t total_length = 128; __ubuf__ uint8_t dst[total_length / 8]; __ubuf__ half src[total_length]; half scalar = 20; uint8_t repeat = 1; uint8_t dst_block_stride = 1; uint8_t src_block_stride = 1; uint8_t dst_repeat_stride = 8; uint8_t src_repeat_stride = 8; …… // 数据搬运及同步操作 asc_ge_scalar(dst, src, scalar, repeat, dst_block_stride, src_block_stride, dst_repeat_stride, src_repeat_stride); …… // 同步操作

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/865975/

相关文章:

  • 海康扫码枪TCP和串口(COM)协议到底怎么选?一个实际项目中的踩坑与选型指南
  • 【Linux】Linux性能调优实战:从CPU到内存
  • 2026 年电缆桥架厂家发展现状分析(附核心数据) - GrowthUME
  • 长期使用Taotoken聚合服务对开发工作流的效率提升体会
  • AI 智慧教学科研平台,以智能技术赋能高校教研数字化转型
  • LRCGET:三步完成本地音乐歌词批量下载的终极解决方案
  • 【ChatGPT FAQ页面生成实战指南】:20年资深工程师亲授5大避坑法则与3套即用模板
  • 大模型底层到底有多简单?看懂这40行核心代码,你就能用C++纯手写一个GPT-2推理引擎
  • D2L库安装避坑指南:从清华源选版到虚拟环境配置,一次搞定所有报错
  • 2026年海南注册公司+代理记账委托代办,老牌口碑专业靠谱代办机构TOP榜单出炉,全岛企业适配! - GrowthUME
  • Mythos模型:从漏洞发现到因果建模的安全AI范式革命
  • 别再手动调色了!3dsMax 2024用MaterialIDsRandomGenerator插件,5分钟搞定模型随机多彩材质
  • 电子干燥柜核心技术解析:从原理到选型,守护精密设备
  • 【仅限首批200家认证企业获取】DeepSeek许可证合规白皮书(含司法判例映射表+监管问询应答模板)
  • ENViews动画原理深度剖析:ValueAnimator与SurfaceView的完美结合终极指南 [特殊字符]
  • 5步实现高效图书元数据管理:国家图书馆ISBN检索插件完整指南
  • 2026海南老板速看:东方市吊销493家企业,你的公司年报报了吗?企业年报异常解除,专业代办机构测评推荐排行TOP榜 - GrowthUME
  • 昇腾CANN cann-recipes-spatial-intelligence:空间智能场景的 NPU 推理实战
  • 【网络】TCP/IP协议深度解析:从连接建立到数据传输
  • 芯片安全IP如何攻克ISO 26262 ASIL-D认证?从原理到实践的深度解析
  • 观察Taotoken平台在流量高峰期的API响应稳定性与容灾表现
  • 观测对比使用Taotoken聚合调用与直连原厂API的延迟体感
  • 3步实现学术文献自由:Zotero SciHub插件终极指南
  • 显存占用暴降65%,渲染速度提升3.8倍,Veo 4K生成设置全解析,深度解读CUDA核心分配逻辑
  • 为OpenClaw配置Taotoken作为模型供应商,快速启动智能体工作流
  • 2026 年气铝合金桥架厂家发展现状分析(附核心数据) - GrowthUME
  • LDDC:一站式精准歌词下载与格式转换解决方案,让每首歌都有完美歌词
  • Java老兵转型AI开发实战指南:收藏这份从零开始的学习路线,小白也能快速上手大模型
  • 端午集粽子助力神器公众号管理系统
  • 使用Taotoken后我们如何观测API用量并控制成本