当前位置: 首页 > news >正文

CANN/asc-devkit C API归约函数文档

asc_reduce_max_datablock

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

找出DataBlock中的最大值,并将最终的计算结果依次保存在dst中的最低位。

函数原型

__simd_callee__ inline void asc_reduce_max_datablock(vector_half& dst, vector_half src, vector_bool mask) __simd_callee__ inline void asc_reduce_max_datablock(vector_float& dst, vector_float src, vector_bool mask) __simd_callee__ inline void asc_reduce_max_datablock(vector_uint16_t& dst, vector_uint16_t src, vector_bool mask) __simd_callee__ inline void asc_reduce_max_datablock(vector_int16_t& dst, vector_int16_t src, vector_bool mask) __simd_callee__ inline void asc_reduce_max_datablock(vector_uint32_t& dst, vector_uint32_t src, vector_bool mask) __simd_callee__ inline void asc_reduce_max_datablock(vector_int32_t& dst, vector_int32_t src, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器)。
src输入源操作数(矢量数据寄存器)。
mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

vector_half dst; vector_half src; vector_bool mask = asc_create_mask_b16(PAT_ALL); asc_loadalign(src, src_addr); // src_addr是外部输入的UB内存空间地址。 asc_reduce_max_datablock(dst, src, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/862216/

相关文章:

  • static-php-cli跨平台构建实战:Linux、macOS、Windows全攻略
  • CANN/pypto topk操作
  • 2026 私域运营很重要!群 SOP+AI 实测领先,私域大师7 大工具横评
  • RTSPtoWebRTC API详解:WebRTC连接建立与媒体传输全流程
  • ThinkPHP-BJYAdmin多模块架构解析:Admin、Api、Home模块分离设计指南
  • Gramophone音乐播放器:基于media3的现代化Android音乐应用完全指南
  • 5分钟快速上手Liquid Time-Constant Networks:从零开始构建第一个LTC模型 [特殊字符]
  • ConfigMap与Secret管理完全指南
  • Static-Program-Analysis-Book中间表示解析:构建高效静态分析器的核心技术
  • Windows驱动开发新时代:windows-drivers-rs项目架构深度解析
  • xfce-winxp-tc部署与打包指南:支持APK、DEB、RPM等多种格式
  • Bpmn Process Designer扩展开发实战:如何自定义流程元素与规则
  • OpenISP 模块拆解 · 第12讲:双边滤波降噪 (BNF)
  • Octopress草稿管理终极指南:如何高效使用publish和unpublish命令
  • 如何快速上手Supersonic:10个新手必学的音乐管理技巧
  • 社群运营必备工具推荐私域大师
  • 如何快速上手 wechatferry:5分钟搭建你的第一个微信机器人
  • Stylis插件开发完全指南:如何扩展CSS预处理功能
  • AI Scientist-v2容器化部署终极指南:使用Docker简化安装与配置的完整教程
  • 终极Node.js日志解决方案:Pino框架在企业环境中的最佳实践
  • Kirikiri游戏开发终极指南:开源工具集完整解决方案
  • Netlify CLI 开发环境配置:如何搭建高效的本地开发工作流
  • 0x.Tools安全最佳实践:如何在非root权限下运行高性能监控
  • node-ar-drone:终极Node.js无人机控制指南 - 从零开始掌握Parrot AR Drone编程
  • Kalliope核心架构深度解析:信号、神经元与突触的完美结合
  • 快速搭建CPS返利小程序教程
  • Legba性能优化技巧:10个实用方法提升暴力破解效率 [特殊字符]
  • 10个Minimal主题实用技巧:从基础配置到高级定制
  • 终极awesome-made-by-brazilians使用手册:从入门到精通
  • CANN/pypto共享内存视图