当前位置: 首页 > news >正文

CANN/ops-nn自适应层归一化算子

AdaLayerNorm

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT×
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品×
Atlas 推理系列产品×
Atlas 训练系列产品×

功能说明

  • 算子功能:AdaLayerNorm算子将LayerNorm和下游的Add、Mul融合起来,通过自适应参数scale和shift来调整归一化过程。

  • 计算公式:

    $$ out = LayerNorm(x) * (1 + scale) + shift $$

    LayerNorm计算公式:

    $$ LayerNorm(x) = {{x-E(x)}\over\sqrt {Var(x)+epsilon}} * weight + bias $$

    其中,E(x)表示输入的均值,Var(x)表示输入的方差。

参数说明

参数名输入/输出/属性描述数据类型数据格式
x输入表示进行归一化的输入数据,对应公式中的`x`。shape为[B, S, H],其中B支持0到6维。FLOAT32、FLOAT16、BFLOAT16ND
scale输入表示自适应缩放参数。对应公式中的`scale`。shape为[B, H]或[B, 1, H],其中B支持0到6维,维度数量和大小与`x`中的B保持一致,H与`x`中H维一致。FLOAT32、FLOAT16、BFLOAT16ND
shift输入表示自适应偏移参数。对应公式中的`shift`。shape为[B, H]或[B, 1, H],其中B支持0到6维,维度数量和大小与`x`中的B保持一致,H与`x`中H维一致。FLOAT32、FLOAT16、BFLOAT16ND
weight可选输入表示归一化缩放参数。对应公式中的`weight`。shape为[H],H与`x`中H维一致。FLOAT32、FLOAT16、BFLOAT16ND
bias可选输入表示归一化偏移参数。对应公式中的`bias`。shape为[H],H与`x`中H维一致。FLOAT32、FLOAT16、BFLOAT16ND
epsilon可选属性
  • 添加到分母中的值,以确保数值稳定,对应公式中的`epsilon`。
  • 默认值为1e-5f。
FLOAT32-
out输出表示归一化后的结果,对应公式中的`out`。shape与`x`保持一致。FLOAT32、FLOAT16、BFLOAT16ND

约束说明

调用说明

调用方式样例代码说明
aclnn接口test_aclnn_ada_layer_norm通过aclnnAdaLayerNorm接口方式调用AdaLayerNorm算子。

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/794450/

相关文章:

  • 手把手教你用9款AI工具,30分钟生成20万字计算机论文并自动匹配代码 - 麟书学长
  • 革命性云原生运维平台SREWorks:一站式解决企业运维难题
  • NCM解密工具终极指南:3步解锁网易云音乐加密文件
  • CANN Ascend C uint32转bfloat16函数
  • 5分钟告别百度网盘提取码烦恼:智能获取工具全解析
  • GE模型加载卸载API
  • 终极指南:3步解决Dell G15笔记本过热问题,开源温度控制中心完全解析
  • XUnity.AutoTranslator完全指南:轻松实现Unity游戏实时翻译的终极方案
  • CANN/asc-devkit Reset函数说明
  • CANN/Ascend C SetSkipMsg API
  • 见素抱朴的 SAP UI5 开发之道, 从「绝圣弃智」到少代码、少炫技、少内耗的前端工程
  • Seraphine:英雄联盟玩家的智能数据助手,三步解锁游戏信息优势
  • BepInEx 6.0.0插件框架稳定性修复:从崩溃现象到IL2CPP签名耗尽问题的深度解析
  • CANN/asc-devkit异或运算API文档
  • IPBan快速入门:一键安装配置,立即阻止僵尸网络入侵
  • 如何为Unity游戏添加实时多语言翻译:XUnity.AutoTranslator终极指南
  • 长期项目使用Taotoken按Token计费模式带来的成本优化体感
  • Yeti社区插件生态解析:如何利用现有资源快速扩展平台功能
  • 【审计专栏】招投标领域人工智能审计——3 算法篇 招投标围标串标行为、检测模型与评估体系 第一部分
  • XUnity.AutoTranslator完整指南:如何为Unity游戏添加智能实时翻译功能
  • 3分钟极速获取百度网盘提取码:开源工具完整使用教程
  • Godot 3 Demos终极指南:从零开始构建你的第一个2D游戏 [特殊字符]
  • CANN昇腾算子开发套件
  • CANN/ops-nn快速层归一化算子
  • CANN/asc-devkit绝对值函数API文档
  • 解放双手,回归乐趣:《崩坏:星穹铁道》智能自动化助手完全指南
  • face-recognition.js 模型训练与保存:构建可复用的人脸识别系统
  • 3步快速部署GitHub中文化插件:告别英文界面的烦恼
  • 我怀疑我电脑里有感染性病毒
  • ustcthesis与Overleaf完美结合:云端LaTeX写作新体验