当前位置: 首页 > news >正文

DAY 37 早停策略与模型权重保存

📝 DAY 37 早停策略与模型权重保存


一、怎么判断模型过拟合?

过拟合就是模型在训练集表现特别好,但在测试集表现变差的情况。

  • 方法:同时打印训练集和测试集的指标(比如损失、准确率)
  • 信号:训练集损失持续下降,测试集损失先降后升,两者差距越来越大 → 过拟合了!

二、模型保存的 3 种方式

根据不同需求,选不同保存方法:

方式保存内容优点适用场景
仅保存权重只存模型参数(轻量级)文件小、加载快✅ 模型部署(推理)、跨设备迁移
保存权重 + 模型结构连模型结构一起存加载后直接用,不用重写网络结构✅ 快速验证、代码共享
保存全部信息(Checkpoint)权重 + 模型结构 + 优化器状态 + 当前 epoch 数支持断点续训✅ 长时间训练、意外中断后继续训练

💡 对应文件后缀:

  • 仅权重 / 权重 + 结构:.pth
  • Checkpoint(断点续训):.ckpt
  • 跨框架迁移(比如给 TensorFlow 用):导出为.onnx格式

三、早停策略(防止过拟合的神器)

早停就是在模型开始过拟合前,提前结束训练,不用跑完所有 epoch。

核心逻辑

patience(耐心值)和counter(计数器)来监控测试集损失:

  • patience:允许测试集损失连续多少轮不改善的最大次数
  • counter:当前连续没改善的轮数

不同情况怎么处理?

测试集损失趋势counter 状态早停是否触发训练结果
持续下降始终为 0❌ 不触发一直训练到设定的num_epochs轮结束
稳定 / 波动(没超过 patience)小于 patience❌ 不触发继续训练,再观察几轮
上升且连续patience轮没改善等于 patience✅ 触发提前终止训练,保存当前最好模型

四、一句话速记

  • 过拟合判断:看训练集和测试集指标差距
  • 保存选择:部署用.pth权重,续训用.ckpt断点,跨框架用.onnx
  • 早停逻辑:测试集损失连续patience轮不改善,就停!

@浙大疏锦行

http://www.jsqmd.com/news/537647/

相关文章:

  • 5分钟掌握模组管理:从新手到高手的蜕变指南
  • nli-distilroberta-base环境部署:ARM架构服务器(如树莓派5)上CPU轻量部署方案
  • 通义千问1.5-1.8B-Chat-GPTQ-Int4 Python入门实战:零基础快速部署与调用
  • Java开发者指南:将DAMOYOLO-S模型服务封装为高性能微服务
  • Zotero插件Ethereal Style:提升学术研究效率的文献管理工具
  • 一篇关于论文复现的思考:基于领域相似度的复杂网络节点重要度评估算法
  • 税务季钓鱼攻击中合法远程管理工具的滥用机制与防御策略研究
  • OpenClaw对接百川2-13B实战:本地部署与飞书机器人配置指南
  • TranslucentTB:解决Windows任务栏视觉割裂的轻量级透明化方案(附5个实用技巧)
  • LingBot-Depth快速部署指南:开箱即用,让商品图片拥有深度维度
  • 零基础入门SenseVoiceSmall:手把手教你识别语音中的喜怒哀乐
  • 终极Windows字体美化指南:3步用MacType告别模糊文字,提升视觉体验![特殊字符]
  • ThinkPad双风扇深度解析:TPFanCtrl2实战配置与性能优化指南
  • Qt串口绘图实战:用QCustomPlot打造20曲线动态显示上位机(附避坑指南)
  • TranslucentTB终极指南:Windows任务栏透明化工具依赖错误完全修复方案
  • Wan2.2-I2V-A14B GPU加速原理:FlashAttention-2如何减少KV缓存显存占用
  • 造相-Z-Image-Turbo 在计算机网络教学中的应用:可视化展示协议交互角色
  • 模拟OJ1 2 3
  • Ubuntu 20.04安装MATLAB R2023B保姆级避坑指南:从卸载旧版到选对产品,一步一截图
  • WebPlotDigitizer:从图表图像中高效提取数值数据的完整指南
  • OpenClaw备份自动化:Qwen3-32B镜像驱动的重要文件加密归档
  • Agent相关面试题
  • 火星探测器通信系统设计与关键技术解析
  • SDMatte辅助游戏开发:快速生成2D游戏精灵与UI资源
  • SDMatte Web界面用户体验地图:从首次访问到批量导出的全流程触点分析
  • 哔哩下载姬:让B站视频获取与处理效率倍增的全能工具
  • 别再重启节点了!手把手教你用ROS 2参数回调实现PID控制器在线调参(Python/rclpy)
  • TranslucentTB:打造高效个性化Windows任务栏的3大核心价值与实践指南
  • Python工业视觉落地难?3个99%工程师忽略的部署断点及72小时解决方案
  • B站视频转文字:如何让知识获取效率提升300%?