当前位置: 首页 > news >正文

CANN/asc-devkit:asc_storealign_1st_postupdate函数文档

asc_storealign_1st_postupdate

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

从矢量数据寄存器搬出第一个元素到UB的接口,忽略mask,向dst_align32b中搬运src第一个元素,接口调用后自动更新目的操作数地址。支持数据类型为b8、b16、b32。

函数原型

__simd_callee__ inline void asc_storealign_1st_postupdate(__ubuf__ int8_t*& dst_align32b, vector_int8_t src, int32_t offset) __simd_callee__ inline void asc_storealign_1st_postupdate(__ubuf__ uint8_t*& dst_align32b, vector_uint8_t src, int32_t offset) __simd_callee__ inline void asc_storealign_1st_postupdate(__ubuf__ int16_t*& dst_align32b, vector_int16_t src, int32_t offset) __simd_callee__ inline void asc_storealign_1st_postupdate(__ubuf__ uint16_t*& dst_align32b, vector_uint16_t src, int32_t offset) __simd_callee__ inline void asc_storealign_1st_postupdate(__ubuf__ int32_t*& dst_align32b, vector_int32_t src, int32_t offset) __simd_callee__ inline void asc_storealign_1st_postupdate(__ubuf__ uint32_t*& dst_align32b, vector_uint32_t src, int32_t offset) __simd_callee__ inline void asc_storealign_1st_postupdate(__ubuf__ half*& dst_align32b, vector_half src, int32_t offset) __simd_callee__ inline void asc_storealign_1st_postupdate(__ubuf__ float*& dst_align32b, vector_float src, int32_t offset) __simd_callee__ inline void asc_storealign_1st_postupdate(__ubuf__ bfloat16_t*& dst_align32b, vector_bfloat16_t src, int32_t offset)

参数说明

参数名输入/输出描述
dst_align32b输入/输出目的操作数(矢量)的起始地址,搬运完成后该地址会被硬件自动Post Update。
src输入源操作数(矢量数据寄存器)。
offset输入地址偏移量。

矢量数据寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

__ubuf__ half* dst_align32b = (__ubuf__ half*)asc_get_phy_buf_addr(0); vector_half src; int32_t offset = 128; asc_storealign_1st_postupdate(dst_align32b, src, offset);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1120371/

相关文章:

  • 深度评测:为什么Markdown-Edit仍是Windows平台最佳轻量级Markdown编辑器选择
  • 手写体识别终极指南:PaddleOCR如何让潦草文字“开口说话“?
  • Juggl数据存储机制:深入理解ObsidianStore与核心数据架构
  • UI-TARS:如何让AI真正理解并操作你的电脑界面?
  • 如何在iOS设备上打造极致漫画阅读体验?E-Hentai Viewer深度解析
  • 3步快速上手Qwen2.5-Coder-14B:从下载到AI代码生成的完整指南
  • 计算机毕业设计之springboot校园跳蚤市场平台设计与实现
  • yuzu模拟器完整指南:在PC上畅玩Switch游戏的终极方案
  • 伺服系统抖动与跟随误差的示波器诊断方法
  • 2025年隐私搜索新选择:Whoogle-Search零门槛部署完整指南
  • GB28181架构革命:容器化部署突破企业级视频监控平台建设瓶颈
  • SQL分区表技术:SQL Ultimate Course大数据处理方案
  • 三步打造你的智能车辆数据中心:TeslaMate深度应用指南
  • RingAttention核心功能全解析:分布式计算如何让千万级token训练成为可能
  • Vault-Operator升级策略:零停机时间升级Vault集群的完整指南
  • 计算机网络技术(考试练习)
  • Elasticsearch Rust Client实战案例:构建实时日志分析系统 [特殊字符]
  • Nginx配置安全扫描:15种常见风险检测与加固实战
  • 探秘spatie/menu架构:Menu、Link与Html类的协作原理与扩展方式
  • gulp-load-plugins核心功能解析:为什么它是Gulp开发者的必备工具
  • 7步精通深度相机三维点云生成:从硬件配置到高级优化的实战指南
  • AI技能库驱动Cypress自动化测试:从自然语言到生产级代码
  • wiliwili跨平台5步构建:游戏主机的B站终极解决方案
  • 深度解析:Lightpanda如何通过9倍内存效率重新定义无头浏览器标准
  • 量子算法入门指南:Shor与Grover算法的终极解析
  • CSS-Filters-Polyfill源码解析:从CSS解析到浏览器适配的实现原理
  • 计算机毕业设计之springboot小薇商城购物系统设计与实现
  • 大一离散数学建模:nwpu-cram图论应用案例解析
  • Flutter游戏开发终极指南:如何获取帮助与贡献代码的完整教程
  • 紫队演练框架PTEF角色与职责:建立高效安全团队协作机制