当前位置: 首页 > news >正文

CANN/asc-devkit Crd2Idx函数

Crd2Idx

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

Crd2Idx函数用于将多维坐标(Coordinate)通过布局(Layout)转换为内存位置索引(Index),这里的Layout包含了Shape和Stride信息。

对于一个布局Layout,其Shape为(d0, d1, ..., dn),Stride为(s0, s1, ..., sn),Coordinate为(c0, c1, ..., cn)到线性索引Index的转换公式为:

例如,对于Shape (3, 4, 5),Stride (20, 5, 1)和Coordinate (1, 2, 3):

维度0:c₀ * s₀ = 1 * 20 = 20 维度1:c₁ * s₁ = 2 * 5 = 10 维度2:c₂ * s₂ = 3 * 1 = 3 Index = 20 + 10 + 3 = 33

当Coordinate维度和Stride维度不相同时,可以采用去线性化(delinearize)的方法,使得Coordinate维度和Stride维度相同,再使用上述公式计算得到最终结果。

去线性化的方法介绍如下:对于一个n维数组,形状为(d0, d1, ..., dn),线性坐标c对应的多维坐标(c0, c1, ..., cn),可以通过以下公式进行转换:

例如:对于Shape ((2, 4), (3, 5)),Stride((3, 6), (1, 24)),Layout((2, 4), (3, 5)) : ((3, 6), (1, 24)),Coordinate(11, 12),按照列优先原则,Crd2Idx的结果为:

crd2idx = delinearize(11, 12) * stride = ((11 % 2, 11 / 2), (12 % 3, 12 / 3)) * ((3, 6), (1, 24)) = ((1, 5), (0, 4)) * ((3, 6), (1, 24)) = 1 * 3 + 5 * 6 + 0 * 1 + 4 * 24 = 129

总结上述过程,计算公式如下:

其中(d0, d1, ..., dn)为Shape,(s0, s1, ..., sn)为Stride,delinearize公式展开如下:

函数原型

// Layout输入,Coordinate转换为Index template <typename T, typename U, typename S> __aicore__ inline constexpr auto Crd2Idx(const T& coord, const Layout<U, S>& layout) // Shape和Stride输入,Coordinate转换为Index template <typename T, typename Shape, typename Stride> __aicore__ inline constexpr auto Crd2Idx(const T& coord, const Shape& shape, const Stride& stride)

参数说明

表 1模板参数说明

|参数名|描述| |--|--| | T | 张量坐标coord类型 | | U/Shape | 张量逻辑形状shape类型 | | S/Stride | 张量步长stride类型 |

表 2参数说明 | 参数名 | 输入/输出 | 描述 | |--------|----------|------| | coord | 输入 | Std::tuple结构类型,用于表示张量在不同维度上的坐标值。
输入的数据类型支持size_t和Std::Int。 | | layout | 输入 | 输入的Layout对象。
输入的数据类型支持Layout类型。 | | shape | 输入 | Std::tuple结构类型,用于定义数据的逻辑形状,例如二维矩阵的行数和列数或多维张量的各维度大小。
输入的数据类型支持size_t和Std:Int。 | | stride | 输入 | Std::tuple结构类型,用于定义各维度在内存中的步长,即同维度相邻元素在内存中的间隔,间隔的单位为元素,与Shape的维度信息一一对应。
输入的数据类型支持size_t和Std::Int。 |

返回值说明

返回根据Coordinate信息转换之后的索引值。

约束说明

输入参数需满足对应的数据类型要求。

调用示例

using namespace AscendC::Te; // Layout形式入参计算索引值 constexpr int M = 11; constexpr int N = 12; constexpr int blockM = 13; constexpr int blockN = 14; auto coord = MakeCoord(AscendC::Std::Int<20>{}, AscendC::Std::Int<30>{}); auto shape = MakeShape(MakeShape(AscendC::Std::Int<blockM>{}, AscendC::Std::Int<M/blockM>{}), MakeShape(AscendC::Std::Int<blockN>{}, AscendC::Std::Int<N/blockN>{})); auto stride = MakeStride(MakeStride(AscendC::Std::Int<blockN>{}, AscendC::Std::Int<blockM*blockN>{}),MakeStride(AscendC::Std::Int<1>{}, AscendC::Std::Int<M*blockN>{})); auto layout = MakeLayout(shape, stride); auto index = layout(coord); // decltype(index)::value = 590 index = Crd2Idx(coord, layout); // decltype(index)::value = 590 // Shape和Stride形式入参计算索引值 auto blockCoordM = AscendC::Std::Int<11>{}; auto blockCoordN = AscendC::Std::Int<12>{}; auto baseShapeM = AscendC::Std::Int<13>{}; auto baseShapeN = AscendC::Std::Int<14>{}; auto basestrideM = AscendC::Std::Int<15>{}; auto basestrideN = AscendC::Std::Int<16>{}; auto coord = MakeCoord(AscendC::Std::Int<0>{}, blockCoordN); auto shape = MakeShape(MakeShape(baseShapeM, baseShapeM), MakeShape(baseShapeN, baseShapeN)); auto stride = MakeStride(MakeStride(basestrideM, basestrideM), MakeStride(basestrideN, basestrideN)); auto index = Crd2Idx(coord, shape, stride); // decltype(index)::value = 192

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/863901/

相关文章:

  • Mac Mouse Fix深度配置指南:如何实现专业级鼠标定制与平滑滚动优化
  • 5大核心优势:彻底解决显卡驱动残留问题的专业工具
  • R3nzSkin国服换肤工具:免费解锁英雄联盟全皮肤的完整指南
  • 5分钟掌握WeKWS:打造智能设备的语音唤醒终极指南
  • 液压万能拉力试验机行业品牌排行榜用途趋势与选购全解析 - 品牌推荐大师
  • 如何一键管理数千首歌曲的同步歌词?智能字幕生成工具LRCGET深度解析
  • 2026年精选AI写作辅助网站合集(实测甄选版)
  • ToolsFx密码学工具箱:一站式解决你的数据安全与编码转换需求
  • WarcraftHelper:魔兽争霸III终极增强插件 - 简单三步让经典游戏焕发新生
  • 金融数据获取革命:AKShare如何用Python简化量化研究的数据挑战
  • 3步打造完美中文Kodi媒体中心:视频搜索与字幕解决方案
  • 中兴光猫工厂模式解锁神器:zteOnu让你的网络管理权限瞬间升级
  • 魔兽争霸3兼容性修复终极指南:告别闪退卡顿的智能解决方案
  • 终极指南:如何在OBS Studio中免费使用VST插件实现专业级音频处理
  • 全网详细 OpenClaw 本地部署学习笔记
  • 伪装 Android 应用运营商计费欺诈的攻击机理与防御研究
  • DownGit:3分钟掌握GitHub精准下载的必备技能
  • 仿冒 Word 钓鱼攻击中可信远程工具滥用机理与企业防御研究
  • 从零开始在Python项目中接入并使用Taotoken管理API调用
  • DroidCam OBS插件:如何将智能手机摄像头变为专业直播设备?
  • TwicketSegmentedControl性能优化终极指南:内存管理与渲染技巧深度解析
  • Asimov支持的开发依赖类型详解:从Node.js到Python、Go、Rust全覆盖
  • 为什么高端外墙砖更值得投入?以国龙为例,揭秘一线品牌在安全、设计与工艺上的深层价值 - 品牌评测官
  • Bilibili-Evolved界面美化终极指南:打造个性化B站浏览体验
  • 如何解决黑苹果USB端口识别问题:USBInjectAll内核扩展完整指南
  • 工业厂区无感化安防,无感定位替代UWB实现无人值守
  • Airflow Maintenance Dags:7个关键维护工作流彻底解决Airflow运维难题
  • 数字人行业核心误区:动态形象≠真正智能交互
  • 中文聊天语料库:一站式解决对话AI训练数据难题
  • 如何用ESP32制作你的专属开源智能手表:DIY终极指南