当前位置: 首页 > news >正文

梯度检查

梯度检查(Gradient Checking)中使用的双边逼近(Two-sided Approximation)方法,也称为中心差分法(Central Difference Method)。
梯度检查的目的
在深度学习中,我们使用反向传播算法(Backpropagation)来计算损失函数关于模型参数的梯度。然而,反向传播的实现复杂,容易出错。
梯度检查是一种数值方法,用于验证反向传播计算出的解析梯度(Analytical Gradient)是否正确。它通过使用函数值的微小变化来数值逼近梯度。
 

image

 

为什么双边逼近更好? 
双边逼近的主要优势在于其更高的准确性 
  • 误差更小:双边逼近的误差项是
    O(ϵ2)cap O open paren epsilon squared close paren
    𝑂(𝜖2)
    级别的(与
    ϵepsilon
    𝜖
    的平方成正比)。这意味着,如果
    ϵepsilon
    𝜖
    很小,双边逼近的误差比单边逼近小得多。
    • 例如,如果
      ϵ=0.01epsilon equals 0.01
      𝜖=0.01
      ,单边误差约为
      0.010.01
      0.01
      ,而双边误差约为
      0.00010.0001
      0.0001
  • 对称性:它在
    θtheta
    𝜃
    点周围对称地采样,更好地捕捉了该点的局部斜率。 
梯度检查的实现步骤 
在实际应用中,梯度检查涉及将解析梯度与数值梯度进行比较: 
  1. 计算解析梯度:使用反向传播算法计算模型的梯度
    ganalyticg sub analytic end-sub
    𝑔analytic
  2. 计算数值梯度:对模型的每个参数
    θitheta sub i
    𝜃𝑖
    ,使用双边逼近公式计算其数值梯度
    gnumeric,ig sub numeric comma i end-sub
    𝑔numeric,𝑖
  3. 比较:计算解析梯度和数值梯度之间的相对差(Relative Difference) 
Relative Difference=|ganalytic−gnumeric||ganalytic|+|gnumeric|Relative Difference equals the fraction with numerator the absolute value of g sub analytic end-sub minus g sub numeric end-sub end-absolute-value and denominator the absolute value of g sub analytic end-sub end-absolute-value plus the absolute value of g sub numeric end-sub end-absolute-value end-fraction
RelativeDifference=|𝑔analytic−𝑔numeric||𝑔analytic|+|𝑔numeric|
  1. 判断
    • 如果相对差小于
      10-710 to the negative 7 power
      10−7
      10-810 to the negative 8 power
      10−8
      ,说明反向传播的实现很可能是正确的。
    • 如果相对差大于
      10-510 to the negative 5 power
      10−5
      ,通常意味着你的反向传播实现可能存在错误(Bug)。
 
 
http://www.jsqmd.com/news/38538/

相关文章:

  • 荆门定制西林瓶灌装机费用解析,比标准款贵多少?
  • 基于Ubuntu2504部署OpenStack E版
  • P13508 [OOI 2024] Burenka and Pether
  • 常见的无状态服务与典型有状态服务
  • CF1720D2 Xor-Subsequence (hard version)
  • 如何实现大模型和本企业内部知识相结合形成一个适合本企业的小模型
  • etcd的压缩和碎片整理提升性能
  • Maven 继承的“隐形杀手”:被你忽略的 relativePath
  • 【SPIE出版 | 往届会后3个月完成EI检索】第二届遥感与数字地球国际学术会议 (RSDE 2025)
  • 基础模型+场景微调
  • 血月奇观科学解码:当“红月亮”邂逅古今文明,一场跨越千年的宇宙浪漫
  • 使用产品密钥升级Windows 11专业版及Windows 11专业工作站版
  • 局域网扫码枪/局域网二维码接收工具
  • Rust:关于Future和JoinHanlder的思考
  • 2025年衣柜顶线定做厂家权威推荐榜单:石膏顶线/欧式顶线/脚线源头厂家精选
  • 完整教程:AI编程工具(Cursor/Copilot/灵码/文心一言/Claude Code/Trae)AI编程辅助工具全方位比较
  • 【IEEE出版 | 连续4年稳定EI检索】第五届新能源与电力工程国际学术会议(ICNEPE 2025)
  • 习题解析之:计算圆周率——拉马努金法
  • 【刷题笔记】Placing Squares
  • P2279 [HNOI2003] 消防局的设立 题解加总结
  • 火车头采集器教程:夸克网盘批量转存(附工具)
  • 售后无忧!CRMEB售后订单处理指南,高效管理退款退货流程
  • 全景式数据库风险监测的理论与实践:加密防御与低误差识别的安全革新
  • 5分钟极简代码:轻松学会XXTEA加密解密
  • 痛苦在虚无中回荡 神最终恩赐了绝望 是爱恨交织的冲撞 你永无力再违抗
  • 习题解析之:计算圆周率——无穷级数法
  • 实用指南:JVM(十)-- 类的加载器
  • Qoder 降价,立即生效!首购 2 美金/月
  • AE扩展-After Ease v1.1.4 关键帧动画曲线缓入缓出调节
  • 更新了!微信公众号文章数据批量导出excel软件1.1版,轻松实现统计分析