当前位置: 首页 > news >正文

深度学习之批量归一化的原理

Batch Normalization(批标准化)是一种深度学习中常用的技术,用于提高神经网络的训练速度和稳定性。它由 Sergey Ioffe 和 Christian Szegedy 在 2015 年的论文《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》中提出。
 
核心思想:减少“内部协变量偏移”(Internal Covariate Shift)
在训练深度神经网络时,每一层输入的分布都在不断变化,因为前一层的参数在持续更新。这种现象被称为**“内部协变量偏移”(Internal Covariate Shift, ICS)**。
ICS 导致的问题包括:
  1. 训练缓慢:网络需要不断适应新的输入分布,导致学习率必须设置得很低,训练过程变慢。
  2. 梯度消失/爆炸:输入数据在深层网络中可能变得非常大或非常小,影响训练稳定性。
  3. 对初始化敏感:网络性能高度依赖于参数的初始值。
Batch Normalization 的目的就是解决 ICS,通过强制规范化每一层网络的输入,使其保持在一个稳定的分布范围内。
 
Batch Normalization 的工作原理
Batch Normalization 在网络的每一层(通常是在全连接层或卷积层的输出、激活函数之前)插入一个操作。它针对**一个“批次”(Batch)**的数据,计算该批次所有样本的均值(mean)和方差(variance),然后使用这两个统计量对该批次的数据进行标准化。
具体过程可以分为四个步骤:
 
 

image

 

训练与推理的区别 
  • 训练阶段:如上所述,使用当前批次的均值和方差。
  • 推理/测试阶段:在推理时,通常一次只处理一个样本,无法计算批次统计量。因此,需要使用在训练过程中累积的全局均值和全局方差(通常是使用移动平均(Moving Average)来估计)来进行标准化,并应用训练好的𝛾和𝛽参数。
Batch Normalization 的优势
使用 Batch Normalization 可以带来多方面的好处:
  • 加速训练:显著减少了 ICS,使得可以使用更高的学习率而不需要担心不稳定的收敛。
  • 提高稳定性:减少了梯度消失和梯度爆炸的问题,使得训练更深层次的网络成为可能。
  • 正则化效应:BN 在训练中引入了轻微的噪声(因为每个批次的均值和方差都略有不同),这起到了一定的正则化作用,有时可以减少或替代 Dropout 的使用。
  • 降低对初始化的要求:网络对参数的初始值不再那么敏感。
Batch Normalization 是现代深度学习模型(特别是卷积神经网络)中不可或缺的一部分。
http://www.jsqmd.com/news/45857/

相关文章:

  • Spark微博舆情分析系统 情感分析 爬虫 Hadoop和Hive 贴吧资料 双平台 讲解视频 大内容 Hadoop ✅
  • LIB3:MISC固件库 - LI,Yi
  • AT_abc250_h [ABC250Ex] Trespassing Takahashi
  • 11/20
  • Langchain Splitter源码阅读笔记(一)CharacterTextSplitter
  • 《从“直接对话”到 “集成开发调用”:智谱 GLM-4.6 引领 Coding 场景的效率跃迁》 - 实践
  • 2025-11-20 早报新闻
  • 完整教程:Visual Studio Code 高效开发完全指南(2025年更新版)
  • 开源低代码平台落地痛点解析
  • 开源低代码 vs 闭源低代码:深度对比与企业选型决策指南
  • Windows 11** 上安装 MySQL
  • Windows 11 上安装 PostgreSQL
  • 2025青岛防水补漏公司怎么选?首选青岛极冠快修,堵漏、漏水检测全业务覆盖,连锁企业值得信赖
  • WebRTC在低时延直播中的应用
  • 合并 K 个升序链表-leetcode
  • 解码线程池
  • Windows 11 上安装 JDK
  • cacti 监控 linux
  • 2025年成都电线电缆采购标杆厂家最新推荐:成都鑫佰亿,电力电缆/高压电缆/中压电缆/低压电缆/铜芯电缆/铝芯电缆/树立电线电缆品质新标准
  • 2025年11月取暖器、电暖器十大品牌权威推荐:石墨烯取暖成主流,告别干燥严寒,解锁全屋舒适暖居体验
  • 社区伙伴活动推荐丨Global night第二场 连线日本!来玩!
  • 2025年成都电线电缆优质供应商推荐:铝合金电缆/家装电线/家用电线/铜芯电线/硬芯线/软电线/成都鑫佰亿,以品质与服务树立行业新标杆
  • 用了会Windows 10
  • Linux初级知识:sudo 提权
  • 2025 年 11 月牛奶分析仪厂家推荐排行榜,实验室/进口/全自动牛奶分析仪,乳品厂/奶农/牧场用牛奶分析仪,德国盖博/FUNKE GERBER/LUM及美国PerkinElmer品牌精选
  • 洛谷P1962 斐波那契数列 题解 矩阵快速幂
  • 2025最新青岛防水补漏服务TOP5口碑推荐:防水补漏/防水/补漏/堵漏/漏水检测服务全评测,守护建筑安全防线
  • 2025年11月汽车陪练十大品牌权威推荐:新手驾到领衔,科学陪驾助你从容上路,告别马路焦虑
  • 哈希表封装myunordered_map以及set - 详解
  • 2025 年语音 AI 趋势十大洞察丨Voice Agent 学习笔记