当前位置: 首页 > news >正文

CANN/Ascend C原子最小操作API

asc_set_atomic_min

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

设置计算结果以原子比较的方式传输到GM。在拷贝前,将待传输的数据与GM中已有数据进行逐元素比较,并将最小值写入GM。数据类型支持int8_t/int16_t/int32_t/bfloat16_t/half/float。

函数原型

__aicore__ inline void asc_set_atomic_min_int8() __aicore__ inline void asc_set_atomic_min_int16() __aicore__ inline void asc_set_atomic_min_bfloat() __aicore__ inline void asc_set_atomic_min_float16() __aicore__ inline void asc_set_atomic_min_int() __aicore__ inline void asc_set_atomic_min_float()

参数说明

返回值说明

流水类型

PIPE_S

约束说明

使用结束后,建议通过asc_set_atomic_none关闭原子最小操作,以免影响后续相关指令功能。

调用示例

// total_length指参与计算的数据长度,dst是外部输入的float类型的GM内存。 constexpr uint32_t total_length = 256; __ubuf__ int8_t src0[total_length]; __ubuf__ int8_t src1[total_length]; asc_copy_ub2gm(dst, src0, total_length * sizeof(int8_t)); asc_sync_pipe(PIPE_MTE3); asc_set_atomic_min_int8(); asc_copy_ub2gm(dst, src1, total_length * sizeof(int8_t)); asc_set_atomic_none();

结果示例:

输入数据src0:[1, 1, 1, ..., 1] // int8_t类型 输入数据src1:[2, 2, 2, ..., 2] // int8_t类型 输出数据dst:[1, 1, 1, ..., 1] // int8_t类型

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1040705/

相关文章:

  • 终极指南:如何用ZenTao免费开源项目管理软件提升团队效率300%
  • vue-163-music搜索功能全攻略:单曲、歌手、专辑一网打尽
  • SVGuitar高级技巧:实现手绘风格和自定义形状的吉他和弦图
  • 2026年南宁市CPPM考试最新全攻略:科目题型、通过率、备考重点及官方双认证报考机构推荐 - 众智商学院课程中心
  • 深入理解AVBD-demo2d的碰撞检测系统:collide.cpp实现详解
  • Tag Editor未来路线图:AI标签识别与云同步功能展望
  • 解决图像采集难题:pic-gather常见问题与解决方案汇总
  • 2026年市政污水在线溶解氧仪优选品牌TOP10:荧光法技术全面替代下的国产化格局与选型指南 - 仪表品牌榜
  • Standard Notes 完全加密架构解析:从零信任到端到端加密的隐私保护实践
  • CANN/asc-devkit SIMD int32转float函数
  • 2026年值得信赖的反应釜靠谱厂家推荐,体验服务品质之选 - mypinpai
  • Playnite开源游戏库管理神器:三招解决多平台游戏统一管理痛点
  • 高效利用Microchip开发资源:从工具链到实战调试全解析
  • 2027 成都明阳单招开班放大招!预报立减千元,一站式升学服务全曝光 - 成都单招培训
  • 如何快速上手Unity2D Components:初学者必备的10个核心组件
  • 2027 成都融创全新升级|智能化教学体系上线,官方咨询渠道统一公布 - 成都单招培训
  • 4层纵深防御:构建企业级API安全防护体系
  • 2026年6月大型污水处理厂便携式污泥浓度计十大品牌排名:基于市政水务实测数据的技术量化与选型深度分析 - 仪表品牌榜
  • 2026年值得信赖的智能果汁灌装机厂家推荐,体验服务品质之选 - mypinpai
  • 揭秘ZLUDA:让非NVIDIA显卡运行CUDA程序的深度指南
  • 基于YOLOv8的柠檬识别 柠檬分拣检测系统 柠檬等级检测系统设计
  • Loop:重新定义macOS窗口管理的优雅之道
  • 2026防火软接实力口碑榜 采购商照着选不踩坑价格透明 - mypinpai
  • 10个高效使用Tag Editor的技巧:批量编辑、脚本处理和自动重命名
  • Adobe开源中心:探索Adobe开源项目的完整指南
  • CANN/asc-devkit int16转uint8函数
  • PCI总线事务深度解析:从信号交互到配置访问与错误处理
  • 高速ADC芯片MCP37D20-200:数字下变频与PLL时钟配置实战解析
  • 深入解析Motorola MMC2107开发板:从内存映射到裸机调试实战
  • Paralayout入门指南:10分钟掌握iOS像素完美布局神器