当前位置: 首页 > news >正文

初始学习率 0.002

初始学习率 0.002 是 Faster R-CNN 精细微调场景下的保守配置,比标准值 0.02 小10倍,适用于迁移学习冻结Backbone或Warmup预热阶段。

一、0.002 的使用场景

场景1:分层学习率中的Backbone

Python
复制
# Backbone微调慢,Head训练快
optimizer = optim.SGD([{'params': model.backbone.parameters(), 'lr': 0.002},      # 仅0.002{'params': model.rpn.parameters(), 'lr': 0.02},            # 0.02{'params': model.roi_heads.parameters(), 'lr': 0.02 * 1.2} # 0.024
], momentum=0.9)
 
原理:预训练Backbone(如ResNet)已具备通用特征,大lr会破坏其结构,导致训练崩溃。0.002是微调临界点,既学习新知识,又保留旧知识。
http://www.jsqmd.com/news/64308/

相关文章:

  • animation实现卡片翻转动效‌
  • EXTI外部中断
  • 调试工具
  • 完整教程:复盘Netflix的2025:广告业务、线下业态和视频播客
  • 深入解析:Photoshop图形工具组与图层样式
  • Spring Cloud Gateway 源码分析一
  • 利用Eval Villain进行客户端路径遍历(CSPT)漏洞挖掘与利用
  • RocketMQ优缺点及使用场景以及如何保证消息不丢失
  • Daytona:90ms 启动的 AI 代码沙箱基础设施
  • Daytona:90ms 启动的 AI 代码沙箱基础设施
  • 20234320 2025-2026-1 《网络与系统攻防技术》实验八实验报告
  • MongoDB Docker 镜像制作与部署指南 - 教程
  • 东莞水乡也新建了一个人工智能应用创新中心?怎么回事 - ---Wg--
  • 详细介绍:28种CSS3炫酷加载动画:创建引人入胜的网页加载体验
  • RocketMQ 与 Kafka 的详细对比(架构、性能、使用场景)
  • 智商就是贼商,情商就是骗商,美国就是如此
  • 深入解析:Excel斜线表头怎么做?合并单元格后添加对角线+两侧输入文字,新手也能秒会!
  • 深入理解RocketMQ基本原理
  • 内部网关协议——OSPF 协议(开放最短路径优先)(链路状态路由协议) - 指南
  • 剖析全球网络入侵:中国国家级APT组织的技战术与防御指南
  • 限制
  • Revit API 创建模仿官方的实时显示的Dockablepanel
  • 企业智能体化:从系统堆叠到智能体矩阵的组织进化
  • Kafka工作流程及文件存储机制 - 详解
  • 实用指南:微软加速在亚洲扩展云基础设施,推动区域数字化跨越式发展
  • 【GitHub热门项目】(2025-11-09) - 详解
  • 深入解析:Nginx优化与防盗链
  • [GESP202312 三级] 小猫分鱼
  • markdown文档格式分析,再使用python对md文件进行结构化拆解
  • CMake Uninstall