当前位置: 首页 > news >正文

第二讲下梯度下降算法

梯度下降算法

梯度下降有时会使loss不降反而上升原因是:
核心结论是:loss 上升主要源于学习率过高、数据 / 特征问题或模型设置不当,导致优化偏离最优方向。

关键原因

  1. 学习率过大:步长超过最优解范围,每次更新都跳过最小值,甚至远离。
  2. 数据 / 特征问题:数据未归一化(特征尺度差异大),或存在大量噪声、异常值,干扰梯度计算。
  3. 模型设置不当:网络过深导致梯度消失 / 爆炸,激活函数选择不合理(如输出层用 ReLU 处理回归问题),或正则化强度过高。
http://www.jsqmd.com/news/48723/

相关文章:

  • Java云计算技术怎样应对故障
  • 2025-08-02-Sat-T-RabbitMQ
  • Nand2Tetris 笔记
  • 审美积累暗色UI设计超越美学的用户体验
  • 具有超高峰值抑制比和低功耗的全光可调谐微波滤波器
  • 11.23
  • 实用指南:F-INR: Functional Tensor Decomposition for Implicit Neural Representations
  • 实验3 类和对象_基础编程 - yuyue
  • 11/23/2025 一周总结
  • Java云计算技术如何确保稳定
  • java中sql注入的防范措施是什么
  • 【第五章:计算机视觉-项目实战之推荐/广告体系】2.粗排算法-(4)粗排算法模型多目标算法(Multi Task Learning)及目标融合
  • 二分查找刷题总结
  • Solution Set #1
  • zjoi2019 语言
  • Java基础(代码块,内部类,函数式编程,常用API,GUI编程)
  • python: 把png的透明背景转为指定颜色
  • 代码源2025长训_noip
  • PySpark - PCA
  • 组合博弈 sg函数 Nim游戏的板子默写
  • 详细介绍:Ribbon是如何与服务注册中心nacos交互的
  • Day46(16)-F:\硕士阶段\Java\课程代码\后端\web-ai-code\web-ai-project02\tlias-web-management
  • 完整教程:日本生活-东京新干线乘车经验-流程介绍
  • 代码随想录算法训练营第三天:链表part01
  • 2025-07-21-Mon-T-RocketMQ
  • 第一章 简介
  • 2025-07-13-Sun-T-AI-LangChain4j
  • P24_现有网络模型的使用及修改
  • 20232403 2025-2026-1 《网络与系统攻防技术》实验六实验报告
  • 第二讲类神经网络训练不起来