当前位置: 首页 > news >正文

CANN/asc-devkit SIMD向量长度获取函数

GetVecLen

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

x

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

x

Atlas 200I/500 A2 推理产品

x

Atlas 推理系列产品 AI Core

x

Atlas 推理系列产品 Vector Core

x

Atlas 训练系列产品

x

Kirin X90

x

Kirin 9030

x

功能说明

获取RegTensor位宽VL(Vector Length)的大小。

函数原型

__aicore__ inline constexpr uint32_t GetVecLen()

参数说明

返回值说明

Vector Length的大小,单位为byte。

约束说明

调用示例

如下样例通过GetVecLen获取循环迭代次数:

template <typename T> __aicore__ inline void AddCustomImpl(__local_mem__ T *dst, __local_mem__ T *src0, __local_mem__ T *src1, uint32_t calCount) { AscendC::Reg::RegTensor<T> reg0; AscendC::Reg::RegTensor<T> reg1; AscendC::Reg::RegTensor<T> reg2; AscendC::Reg::MaskReg mask; constexpr uint32_t repeatElm = AscendC::GetVecLen() / sizeof(T); uint16_t repeatTime = AscendC::CeilDivision(calCount, repeatElm); for (uint16_t i = 0; i < repeatTime; ++i) { mask = AscendC::Reg::UpdateMask<T>(calCount); AscendC::Reg::LoadAlign(reg0, src0 + i * repeatElm); AscendC::Reg::LoadAlign(reg1, src1 + i * repeatElm); AscendC::Reg::Add(reg2, reg0, reg1, mask); AscendC::Reg::StoreAlign(dst + i * repeatElm, reg2, mask); } }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/853353/

相关文章:

  • 2026西安房屋渗水维修正规公司TOP4:精准堵漏+资质权威 专业防水公司排名推荐(2026年5月防水补漏最新TOP权威排名) - 冠盾建筑修缮
  • 毕业党职场人必备:Word转PDF保留超清插图和目录书签的保姆级方案
  • starter_architecture_flutter_firebase中的Riverpod状态管理:终极指南 [特殊字符]
  • 深入 react-copy-write 源码:理解 Provider、Consumer 与 mutate 的协作机制
  • 2026 泰州黄金回收实用攻略|市场行情解析 + 全域门店点位 + 交易避坑指南 - 鑫顺黄金回收
  • 微信小程序里GIF点一下重播一次?我用随机数拼接轻松解决了
  • 2026 年华西钣金加工优质源头厂家推荐:精密钣金 / 机箱机柜 / 操作台 / 箱变外壳选择指南 - 海棠依旧大
  • TEngine与服务器集成:.NET Core 8.0前后端一体化开发指南
  • 基于利率路径概率模型的180度预期反转:从“年内降息共识”到“重新加息”尾部风险重定价
  • 专业内存取证利器:WinPmem物理内存采集完整指南
  • git撤销某个文件的更改
  • 15分钟搞定黑苹果:OpCore-Simplify如何让OpenCore配置从噩梦变简单?
  • svelte-preprocess 高级用法:多预处理器组合与自定义语言支持的实战案例
  • 20251903 2025-2026-2 《网络攻防实践》第八周作业
  • 2026 淮南高考生近视手术选医选院攻略,医生资质 + 医院实力全对比 - 品牌速递
  • 嵌入式系统性能瓶颈与下一代处理器架构演进方向
  • Perplexity地理查询突然返回空结果?紧急修复指南:3分钟定位OpenStreetMap数据源同步断点+2行代码热修复
  • 全自动吨包机选购指南与品牌排名一览 广州恒尔实力厂家详解吨包设备优劣对比 - 品牌速递
  • 淮南高考生近视手术去哪做?廖荣丰、朱凤领衔合肥普瑞,2026摘镜实力全解析 - 品牌速递
  • 如何用Akagi雀魂AI辅助工具快速提升麻将水平:新手到高手的完整指南
  • 如何快速构建完整的以太坊Go开发实战应用:从入门到精通指南 [特殊字符]
  • 2026年5月最新 超声波泥位检测仪十大品牌榜 - 仪表品牌榜
  • Axure RP — 复杂交互与逻辑验证的终极杀器
  • 淮南近视手术哪家好?2026高考_征兵摘镜必看! - 品牌速递
  • RISC-V RTOS移植实战:从ARM迁移到CH32V307的FreeRTOS移植指南
  • CANN/HCOMM拓扑层级查询
  • Lawnicons入门教程:从下载安装到启用主题化图标的完整流程
  • 2026年5月最新 国内污水管道用管段式超声波流量计十强厂家对比(国产+进口) - 仪表品牌排行榜
  • 暗黑破坏神2存档编辑器完整指南:3步实现角色定制与游戏优化
  • 从毫米波雷达置信度Bug说起:Simulink单元测试如何帮你提前‘排雷’