当前位置: 首页 > news >正文

凭什么要用余弦退火,不用正弦退火

先说结论:

余弦退火功能:让学习率像余弦波一样平滑地先缓降、再快降,最后在谷底温柔触底。

为什么?

先看看公式

看着烦,不看了,核心就是:f(t)

来看看对t求导,其他的不用管 得到一个sin(t / T *Π)* 【一个数】(别管他,不重要,反正你硬要算还是这个数,要学会像电脑一样节省计算资源,当然你钻牛角尖当我没说,或着说,不对不对,我就告诉你,这是关于t的函数,其他视作常数)

那么t 在 0 处(开始)t在 1处(结束)都是 0 这时候的学习率不会变动

看到这里感到蒙?你求导有啥用?导数 0 又有啥用?

还记得导数定义公式吧

条件有限,网上随便找的,你先把x看成t也就是说 ,在h -->0 下

导数值f'(x) * 变化量 h = f(x + h) - f(x) [实际学习率的变化量]

导数为 0,实际 学习率的变化量为 0 也就是说学习率开始结束都不变

但 你 t 在 > 0呢? 他是不是就大了一点 当他t 到 T/2时,也就是变化中期,这个变化巨快 等到你模型快训练完的时候 基本上学习率也固定了

现在你回头看看那部分

但如果把cos换成sin会发生什么事情,相信你也能推断出来了

sinx --》cosx

他在开始和结束 的值都为 1 也就是说 学习率这时候变化巨快 开始还行 但模型训练到最后,你还变那么快 ,这不胡闹嘛!

http://www.jsqmd.com/news/1082871/

相关文章:

  • 双材料打印服务,精准定制每一件精品
  • 优刻得GPU+GLM-5+vLLM推理落地实战:A10高性价比部署指南
  • OpenCore Legacy Patcher终极指南:让老Mac重获新生,体验最新macOS系统
  • 6款论文降AI率平台横评:键清零AI痕迹,这款性价比封神
  • Qwerty Learner:解锁键盘工作者的英语肌肉记忆训练新体验
  • 三步解锁小爱音箱音乐自由:你的专属智能音乐管家
  • WindowResizer:3步解决Windows顽固窗口调整难题的终极免费工具
  • 企业微信AI Agent:企微官方能力+企业微信服务商方案+AI SCRM选型指南解读
  • AI 核算真的能降碳吗? - 蓝色星球
  • 036、CA 坐标注意力插入 Backbone(位置一):把位置信息编码进通道注意力的代码
  • AI 与数字化重塑新能源经销服务:下沉市场门店的转型实践拆解
  • Adobe-GenP终极指南:三步解锁Adobe全家桶专业功能
  • Win11 OpenClaw全流程报错排查指南|解压 / 安装 / 启动问题优化方案
  • 深度揭秘DiskInfo:现代硬盘监测工具开发实战指南
  • 【Springboot毕设全套源码+文档】基于SpringBoot的学生评奖评优管理系统的设计与实现(丰富项目+远程调试+讲解+定制)
  • IT爱学堂-Excel VBA编程与ChatGPT自动化实战-宏录制/条件判断(完结),Python AI 数字化实战:从 Pandas 自动化到 DeepSeek “星逻系统”开发(完结)
  • 高温工况下,温度变送器为什么总是电路板先挂?
  • HMCL启动器终极内存优化指南:让4GB电脑流畅玩转高版本Minecraft [特殊字符]
  • 如何永久保存微信聊天记录?5步掌握数据备份与年度报告生成
  • 踩过 4 个 AI 写作坑才敢说:Gradpaper 才是真・适配毕业论文的专业工具
  • Security threats on Data-Driven Approaches for Luggage Screening论文精读
  • 北京永强数据恢复中心北京排名第一硬盘电机不转故障数据恢复
  • 差异分析R包一大堆,到底该用哪个?一篇帮你理清思路
  • CAT1 RTU工业物联网方案:TCP+Modbus+GNSS三合一设计
  • C 语言指针数据隐藏难题:从原理困惑到巧妙解决
  • KMS_VL_ALL_AIO终极指南:Windows和Office一键激活完整解决方案
  • KeymouseGo:跨平台鼠标键盘自动化工具完整指南
  • 半导体测试数据分析的智能革命:STDF-Viewer如何将数据处理效率提升300%
  • Cpp2IL:如何用这个终极工具破解Unity IL2CPP代码保护
  • Function Calling本质:大模型结构化工具调用的工程实践