当前位置：首页 > news >正文

CANN/ops-nn LayerNorm算子

news 2026/7/9 19:20:14

LayerNorm

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

产品支持情况

产品	是否支持
Ascend 950PR/Ascend 950DT	√
Atlas A3 训练系列产品/Atlas A3 推理系列产品	√
Atlas A2 训练系列产品/Atlas A2 推理系列产品	√
Atlas 200I/500 A2 推理产品	√
Atlas 推理系列产品	√
Atlas 训练系列产品	√

功能说明

算子功能：
对指定层进行均值为0、标准差为1的归一化计算。
- 归一化：对输入张量的每个样本进行归一化处理，使得每个样本的均值为0，方差为1。
- 缩放和偏移：在归一化之后，可以通过缩放因子和偏移量进一步调整归一化后的输出，以适应不同的模型需求。
计算公式：
$$ mean = {E}[x] $$
$$ variance = \mathrm{Var}[x] $$
$$ y = w \times (\frac{x - mean}{ \sqrt{\mathrm{Var}[x] + eps}}) + b $$
其中，E[x]表示输入的均值，Var[x]表示输入的方差。

参数说明

参数名	输入/输出/属性	描述	数据类型	数据格式
x	输入	表示进行归一化计算的输入，公式中的输入x。shape为[A1,...,Ai,R1,...,Rj]，其中A1至Ai表示无需norm的维度，R1至Rj表示需norm的维度。	FLOAT、FLOAT16、BFLOAT16	ND
gamma	输入	表示进行归一化计算的权重，公式中的输入w。gamma非空时，数据类型与输入x一致或为FLOAT类型，且当beta存在时gamma与beta的数据类型相同。shape与normalized_shape相等，为[R1,...,Rj]。gamma为空时，接口内部会构造一个shape为[R1,...,Rj]，数据全为1的tensor，当beta存在时gamma与beta的数据类型相同，beta不存在时gamma与输入x的数据类型相同。	FLOAT、FLOAT16、BFLOAT16	ND
beta	输入	表示进行归一化计算的偏移量，公式中的输入b。beta非空时，数据类型与输入x一致或为FLOAT类型，且当gamma存在时beta与gamma的数据类型相同。shape与normalized_shape相等，为[R1,...,Rj]。beta为空时，接口内部会构造一个shape为[R1,...,Rj]，数据全为0的tensor，当gamma存在时beta与gamma的数据类型相同，gamma不存在时beta与输入x的数据类型相同。	FLOAT、FLOAT16、BFLOAT16	ND
begin_norm_axis	可选属性	表示需要进行norm计算的维度。值为[R1,...,Rj]，长度小于等于输入x的shape长度，不支持为空。默认值为0。	INT	-
begin_params_axis	可选属性	表示参数的起始维度。默认值为0。	INT	-
epsilon	可选属性	添加到分母中的值，以确保数值稳定。默认值为0.00001f。	FLOAT	-
y	输出	表示进行归一化计算的结果，公式中的y。shape需要与x的shape相等，为[A1,...,Ai,R1,...,Rj]。数据类型与x的数据类型保持一致。	FLOAT、FLOAT16、BFLOAT16	ND
mean	输出	表示进行归一化后的均值，公式中的mean。与rstd的shape相同，shape为[A1,...,Ai,1,...,1]，Ai后共有j个1，与需要norm的轴长度保持相同。数据类型与x的数据类型保持一致。	FLOAT、FLOAT16、BFLOAT16	ND
variance	输出	表示进行归一化后的方差，公式中的variance。与mean的shape相同，shape为[A1,...,Ai,1,...,1]，Ai后共有j个1，与需要norm的轴长度保持相同。数据类型与x的数据类型保持一致。	FLOAT、FLOAT16、BFLOAT16	ND

Ascend 950PR/Ascend 950DT ：参数begin_params_axis和begin_norm_axis的值保持一致。

约束说明

无

调用说明

调用方式	调用样例	说明
图模式调用	test_geir_layer_norm	通过算子IR构图方式调用LayerNorm算子。

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

http://www.jsqmd.com/news/793532/

相关文章：

Open3D 点云切片【2026最新版】

为什么头部AI Lab已全员切换SITS2026？揭秘其内置的4层语义校验引擎与实时可观测性埋点设计

别再手动传包了！用K8s InitContainer + BusyBox 5分钟搞定Tomcat应用自动部署

CANN/asc-devkit浮点到整型转换

人才梯队断层、模型迭代滞后、跨职能撕裂——AI团队三大生死症结，SITS2026已开出临床级处方

浅谈Mysql的哈希索引及特点

【限时解密】SITS大会未公开议程泄露：下一代缓存协议Cache-LLMv2将于Q3强制接入HuggingFace生态？

《如果你还愿意等》的搜索理由：等待场景怎样被记住

创业公司利用Taotoken多模型能力进行A/B测试以优化产品效果

基于Dify工作流构建游戏客服多智能体协作系统实践

CANN/asc-devkit：__ll2float_ru函数

AI原生Embedding优化黄金公式（SITS 2026认证级调优框架首次公开）

SunEditor自定义插件开发：从零开始构建你的专属功能

Windows AI智能体安全沙盒：MachineY Engine四层隔离与部署指南

大语言模型合并实战：用mergekit融合Llama与WizardLM构建全能AI

终极django-htmx性能优化指南：如何减少网络请求并提升用户体验 [特殊字符]

CANN/asc-devkit类型转换函数文档

混合量子计算：qumode与qubit协同架构解析

CANN Ascend C断言函数API文档

SREWorks网关组件详解：构建高可用微服务治理体系 [特殊字符]

dnGrep搜索结果分析与报告生成：如何导出和分享搜索数据

retrying部署指南：在不同Python版本和环境中的兼容性终极教程

ARM Cortex-R7低功耗架构设计与动态RAM保留技术

告别虚拟机！Win10+Ubuntu 18.04双系统保姆级安装指南（含BIOS设置与分区避坑）

Godot 3 Demos保存系统实战：游戏数据持久化与配置管理终极指南

Docker Compose多项目管理利器：compose-skill配置与实战指南

CANN/ge ACL设置张量常量

ClosureTree 在企业级应用中的最佳实践：高效构建 ActiveRecord 层级模型

独立开发者如何用AI验证创业点子：15分钟完成市场分析与风险评估