当前位置: 首页 > news >正文

CANN/ops-nn LayerNorm算子

LayerNorm

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品
Atlas 推理系列产品
Atlas 训练系列产品

功能说明

  • 算子功能:

    对指定层进行均值为0、标准差为1的归一化计算。

    • 归一化:对输入张量的每个样本进行归一化处理,使得每个样本的均值为0,方差为1。
    • 缩放和偏移:在归一化之后,可以通过缩放因子和偏移量进一步调整归一化后的输出,以适应不同的模型需求。
  • 计算公式:

    $$ mean = {E}[x] $$

    $$ variance = \mathrm{Var}[x] $$

    $$ y = w \times (\frac{x - mean}{ \sqrt{\mathrm{Var}[x] + eps}}) + b $$

    其中,E[x]表示输入的均值,Var[x]表示输入的方差。

参数说明

参数名输入/输出/属性描述数据类型数据格式
x输入表示进行归一化计算的输入,公式中的输入x。shape为[A1,...,Ai,R1,...,Rj],其中A1至Ai表示无需norm的维度,R1至Rj表示需norm的维度。FLOAT、FLOAT16、BFLOAT16ND
gamma输入表示进行归一化计算的权重,公式中的输入w。gamma非空时,数据类型与输入x一致或为FLOAT类型,且当beta存在时gamma与beta的数据类型相同。shape与normalized_shape相等,为[R1,...,Rj]。gamma为空时,接口内部会构造一个shape为[R1,...,Rj],数据全为1的tensor,当beta存在时gamma与beta的数据类型相同,beta不存在时gamma与输入x的数据类型相同。FLOAT、FLOAT16、BFLOAT16ND
beta输入表示进行归一化计算的偏移量,公式中的输入b。beta非空时,数据类型与输入x一致或为FLOAT类型,且当gamma存在时beta与gamma的数据类型相同。shape与normalized_shape相等,为[R1,...,Rj]。beta为空时,接口内部会构造一个shape为[R1,...,Rj],数据全为0的tensor,当gamma存在时beta与gamma的数据类型相同,gamma不存在时beta与输入x的数据类型相同。FLOAT、FLOAT16、BFLOAT16ND
begin_norm_axis可选属性
  • 表示需要进行norm计算的维度。值为[R1,...,Rj],长度小于等于输入x的shape长度,不支持为空。
  • 默认值为0。
INT-
begin_params_axis可选属性
  • 表示参数的起始维度。
  • 默认值为0。
INT-
epsilon可选属性
  • 添加到分母中的值,以确保数值稳定。
  • 默认值为0.00001f。
FLOAT-
y输出表示进行归一化计算的结果,公式中的y。shape需要与x的shape相等,为[A1,...,Ai,R1,...,Rj]。数据类型与x的数据类型保持一致。FLOAT、FLOAT16、BFLOAT16ND
mean输出表示进行归一化后的均值,公式中的mean。与rstd的shape相同,shape为[A1,...,Ai,1,...,1],Ai后共有j个1,与需要norm的轴长度保持相同。数据类型与x的数据类型保持一致。FLOAT、FLOAT16、BFLOAT16ND
variance输出表示进行归一化后的方差,公式中的variance。与mean的shape相同,shape为[A1,...,Ai,1,...,1],Ai后共有j个1,与需要norm的轴长度保持相同。数据类型与x的数据类型保持一致。FLOAT、FLOAT16、BFLOAT16ND
  • Ascend 950PR/Ascend 950DT :参数begin_params_axis和begin_norm_axis的值保持一致。

约束说明

调用说明

调用方式调用样例说明
图模式调用test_geir_layer_norm通过算子IR构图方式调用LayerNorm算子。

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/793532/

相关文章:

  • Open3D 点云切片【2026最新版】
  • 为什么头部AI Lab已全员切换SITS2026?揭秘其内置的4层语义校验引擎与实时可观测性埋点设计
  • 别再手动传包了!用K8s InitContainer + BusyBox 5分钟搞定Tomcat应用自动部署
  • CANN/asc-devkit浮点到整型转换
  • 人才梯队断层、模型迭代滞后、跨职能撕裂——AI团队三大生死症结,SITS2026已开出临床级处方
  • 浅谈Mysql的哈希索引及特点
  • Python+AI
  • 【限时解密】SITS大会未公开议程泄露:下一代缓存协议Cache-LLMv2将于Q3强制接入HuggingFace生态?
  • 《如果你还愿意等》的搜索理由:等待场景怎样被记住
  • 创业公司利用Taotoken多模型能力进行A/B测试以优化产品效果
  • 基于Dify工作流构建游戏客服多智能体协作系统实践
  • CANN/asc-devkit:__ll2float_ru函数
  • AI原生Embedding优化黄金公式(SITS 2026认证级调优框架首次公开)
  • SunEditor自定义插件开发:从零开始构建你的专属功能
  • Windows AI智能体安全沙盒:MachineY Engine四层隔离与部署指南
  • 大语言模型合并实战:用mergekit融合Llama与WizardLM构建全能AI
  • 终极django-htmx性能优化指南:如何减少网络请求并提升用户体验 [特殊字符]
  • CANN/asc-devkit类型转换函数文档
  • 混合量子计算:qumode与qubit协同架构解析
  • CANN Ascend C断言函数API文档
  • SREWorks网关组件详解:构建高可用微服务治理体系 [特殊字符]
  • dnGrep搜索结果分析与报告生成:如何导出和分享搜索数据
  • retrying部署指南:在不同Python版本和环境中的兼容性终极教程
  • ARM Cortex-R7低功耗架构设计与动态RAM保留技术
  • 告别虚拟机!Win10+Ubuntu 18.04双系统保姆级安装指南(含BIOS设置与分区避坑)
  • Godot 3 Demos保存系统实战:游戏数据持久化与配置管理终极指南
  • Docker Compose多项目管理利器:compose-skill配置与实战指南
  • CANN/ge ACL设置张量常量
  • ClosureTree 在企业级应用中的最佳实践:高效构建 ActiveRecord 层级模型
  • 独立开发者如何用AI验证创业点子:15分钟完成市场分析与风险评估