当前位置: 首页 > news >正文

CANN/Ascend C数据块最小规约函数

asc_reduce_min_datablock

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

根据mask将每个DataBlock(32B)中的最小值,依次保存在dst中的最低位。

函数原型

__simd_callee__ inline void asc_reduce_min_datablock(vector_uint16_t& dst, vector_uint16_t src, vector_bool mask) __simd_callee__ inline void asc_reduce_min_datablock(vector_int16_t& dst, vector_int16_t src, vector_bool mask) __simd_callee__ inline void asc_reduce_min_datablock(vector_half& dst, vector_half src, vector_bool mask) __simd_callee__ inline void asc_reduce_min_datablock(vector_uint32_t& dst, vector_uint32_t src, vector_bool mask) __simd_callee__ inline void asc_reduce_min_datablock(vector_int32_t& dst, vector_int32_t src, vector_bool mask) __simd_callee__ inline void asc_reduce_min_datablock(vector_float& dst, vector_float src, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器)。
src输入源操作数(矢量数据寄存器)。
mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

vector_half dst; vector_half src; vector_bool mask = asc_create_mask_b16(PAT_ALL); asc_loadalign(src, src_addr); // src_addr是外部输入的UB内存空间地址。 asc_reduce_min_datablock(dst, src, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1045201/

相关文章:

  • 2026年宁波GEO获客优化服务商盘点:本土实力阵营解析 - 起跑123
  • Roo Code Memory Bank终极指南:让AI助手记住你的项目上下文
  • VAC进程监控模块完全解析:3种扫描类型与虚拟方法表技术揭秘
  • MC68F375 QSMCM模块深度解析:从寄存器配置到队列SPI实战
  • 团队博客 5:Sprint 3——收官与优化
  • 信任的进化:技术实现详解——如何用JavaScript构建博弈论模拟器
  • 从0到1搭建图像采集流程:pic-gather快速上手指南
  • 2026年宁波GEO获客优化服务商调研与合规推荐 - 起跑123
  • 为什么麦克斯韦方程组如此重要?Intuitive-Guide-to-Maxwells-Equations揭示电磁学的奥秘
  • Paralayout快速开始:5种安装方法让你轻松集成iOS布局工具
  • 5个高效管理远程服务器的实用技巧:使用Viking提升运维效率
  • 3秒极速观影:Jav-Play浏览器扩展终极指南
  • 10分钟完成黑苹果配置:OpCore Simplify终极图形化工具完全指南
  • 枚举类三大应用场景 - -z-w-h
  • 如何安装和配置Google Translate Mac客户端:5分钟快速上手教程 [特殊字符]
  • 终极指南:用YOLOv9快速构建高性能目标检测系统
  • 从零到一:Docker化Magento开发环境的革命性实践
  • 3步解锁免费LLM API宝藏:开发者必知的终极资源指南
  • express-winston性能优化:减少日志开销的7个最佳实践
  • 2026苏州防水补漏维修团队实测盘点TOP4:苏州业主房屋渗漏修缮靠谱选择 - 宅安选房屋修缮
  • winget只下载不安装
  • WebView控制完全掌握:JSBrowser中前进/后退/刷新功能的实现方法
  • 形式化方法 +《大象 Thinking in UML》 - -z-w-h
  • 5步掌握DiT扩散模型:基于Transformer的图像生成终极指南
  • verb快速上手:5步学会创建第一个NURBS曲线和曲面
  • GEO获客优化推广与传统SEO、短视频搜索的差异化体验解析 - 起跑123
  • Camunda BPM平台:5个步骤快速掌握开源工作流自动化框架 [特殊字符]
  • DeepSeek Coder深度解析:让AI代码生成提升你的开发效率300%
  • 传统AI应用架构的碎片化困境与Next.js AI Chatbot的现代化统一解决方案
  • LocalAI:重新定义本地人工智能的边界,让AI回归你的掌控