当前位置: 首页 > news >正文

轮数选择

训练轮数(Epochs) = 完整遍历整个训练集的次数,是控制模型学习深度的核心超参数。

一、定义与计算

1个Epoch = 所有训练样本都参与一次梯度更新

Python
复制
# 示例:8000张图纸,batch_size=4
num_images = 8000
batch_size = 4# 1个epoch包含的iterations
iters_per_epoch = num_images // batch_size = 2000# 若训练12个epoch
total_iters = 12 × 2000 = 24,000次梯度更新
 
关键公式:

总迭代次数=Epochs×Batch Size训练集大小

Faster R-CNN中的训练轮数选择

标准配置(COCO数据集)

yaml
复制
# Detectron2默认
MAX_ITER: 90000      # 对应12 epoch (117k images, batch=16)
STEPS: (60000, 80000) # 在第8/10.7 epoch时降lr
 

图纸场景配置(hbwR-O数据集)

yaml
复制
# 推荐配置
MAX_ITER: 10000      # 12 epoch (8k images, batch=4)
STEPS: (6000, 8000)  # 在第7.2/9.6 epoch时降lr# 经验法则:小数据集训练轮数应≥10 epoch
# 防止欠拟合
 

三、训练轮数的决策树

复制
数据集是否 > 10万张?
├─ 是 → 训练 12-24 epoch (防止欠拟合)
│      └─ 如COCO: 12 epoch
└─ 否 → 训练 10-15 epoch (防止过拟合)├─ 图纸8k张: 12 epoch└─ 若数据 < 1k → 早停 (Early Stopping)
http://www.jsqmd.com/news/64325/

相关文章:

  • NOIP 2025游记
  • 3D模型在线转换
  • Batch Size
  • 2025.12.6-md测试图片
  • 2025.12.6-测试图片
  • 2025
  • vue 实用指令
  • vue 实用指令
  • 【算法题解】MX-S5-T1:王国边缘与倍增跳跃——深入理解内向基环树处理
  • APP开发实用的技术选型:原生 vs 跨端 (Flutter/React Native) 对比与适配场景
  • Sampler AI 材质流:一键“喂”图生成 PBR - 教程
  • anaconda3安装及jupyter环境配置教程
  • 关于排列问题的做题及思考
  • 图论杂题选讲
  • VMware Workstation Pro下载并安装Windows
  • 第4章串、数组和广义表
  • 初始学习率 0.002
  • animation实现卡片翻转动效‌
  • EXTI外部中断
  • 调试工具
  • 完整教程:复盘Netflix的2025:广告业务、线下业态和视频播客
  • 深入解析:Photoshop图形工具组与图层样式
  • Spring Cloud Gateway 源码分析一
  • 利用Eval Villain进行客户端路径遍历(CSPT)漏洞挖掘与利用
  • RocketMQ优缺点及使用场景以及如何保证消息不丢失
  • Daytona:90ms 启动的 AI 代码沙箱基础设施
  • Daytona:90ms 启动的 AI 代码沙箱基础设施
  • 20234320 2025-2026-1 《网络与系统攻防技术》实验八实验报告
  • MongoDB Docker 镜像制作与部署指南 - 教程
  • 东莞水乡也新建了一个人工智能应用创新中心?怎么回事 - ---Wg--