当前位置: 首页 > news >正文

YOLO系列学习三(训练):

!!!如何让训练跑的更快:

一.训练效率:即下面四种硬件资源的利用率

二.两个高效率训练的典型特征:

-cuda的利用率又高又稳

-所有资源利用率都不到100%

三.影响GPU训练效率的4个选项:

1.imgsz选项--->缩放

注:imgsz必须是32的倍数

例如:imgsz=640,就是将图片缩放到一个640×640的正方形里,图片的宽高比例不变

到目前为止的训练的完整流程:

重点:

-imgsz越小,训练越快,但是也是有上限的,并且还与训练效果有关

-Imgsz设置成多少比较合适:一般保持默认的640就行

-比较建议调整的情况有两种:

1.图片尺寸很大,目标一丁点---->imgsz调高一点

2.图片尺寸普遍比640小---->保持原本(接近)的32倍的imgsz

2.batch选项---->批次

一个批次里图片的数量:批量(batch size)

代码里将"batch=2",一次投喂两张图片

硬件条件会限制batch的上限

batch=2 时间:大概42s

batch=8 时间:大概22s

(1)batch对显存占用和训练效率的影响:

-batch太小,显存占用低,训练效率低

-随着batch越调越高,显存占用会变高,训练效率也会变高,但是效率的提升是有限的

-尤其是显存占用快满的时候,效率反而会变差

-batch再高的话,甚至会开始报错

(2)接近最快的batch一般是在一个区间里,我们只需要将batch调整到这个区间就行

方法:将"batch=-1",YOLO就会自动帮你找一个相对合适的batch,调到能差不多接近最快就行

3.cache选项---->缓存

默认cache=False,即不适用缓存

对应cache="ram",即使用内存作为缓存

缓存的核心思想:如果一个东西你经常用,就放到近一点的地方

所有训练集图片都以文件的形式存储下硬盘里,每次训练时,都需要将图片从硬盘加载到内存里,再进行后续操作

cache="ram",提前加载,提前缩放(大概率可以提高训练的效率)

缺点:所有缩放后的图片都会放到 内存里,所以内存要足够大,才能容纳这些图片

4.workers选项---->打包

细节:

-每一轮的每个批次都是随机打包的

-在把每批次的图片拼到一个数据块之前,通常会先随机修改一下

数据增强(修改)----随机放大或缩小一些,接着随机旋转一点角度,再调一调颜色,再从中间裁剪一下

一个批次完整的打包流程:

解决办法:多开几个进程打包:

"worker=1",时间:大概12s

worker每加一,内存就要多消耗一倍

5.邪修路线:

http://www.jsqmd.com/news/107108/

相关文章:

  • 易控:3分钟学会手机远程控制手机的终极指南 [特殊字符]→[特殊字符]
  • 快速上手CT肺部自动分割:lungmask终极使用指南
  • LaTeX3编程革命:从传统宏包到现代结构化开发
  • Lucky ACME证书自动化管理:告别手动续期,拥抱智能HTTPS安全
  • Uppy智能文件过滤:从混乱上传到精准控制的革命性方案
  • 企业AI开发新革命:如何用MCP协议打造智能应用生态
  • 反向代理与 Forwarded 相关 Header 深度解析
  • GLM-4.5-FP8:如何用开源大模型实现高效AI推理
  • AI销售自动化与客户管理的最佳获客软件选择--VertGrow AI销冠
  • 图片查看工具:专业级跨平台图像浏览解决方案
  • break和continue的区别是什么?
  • jetty9配置contextPath
  • NanoPi R5S能否成为你的千兆网络新宠?实测数据告诉你答案
  • 广东AI数字人/智能体/智能化改造/AI一体机/AI搜索推广公司首选湾西小冰——深耕区域AI服务,赋能产业数字化转型 - 全局中转站
  • SeedVR2-7B完整使用指南:三步实现AI视频质量飞跃
  • MouseTester深度评测:数据驱动的鼠标性能精准诊断方案
  • 21 . 字母异位词分组
  • Web开发者快速上手AI Agent:基于提示工程的旅游攻略系统实战
  • 微算法科技(NASDAQ MLGO)区块链混合检测模型优化确保全网防御策略一致性
  • Mermaid Live Editor 终极指南:实时图表编辑的完整解决方案
  • Amazon Bedrock × Claude 实战:从扫描文档到结构化数据的智能处理流程
  • FastSAM自定义数据集终极指南:从零到一的完整流程
  • 实战指南:基于ffmpeg-python构建智能视频质量控制系统
  • AI驱动测试数据生成:从挑战到落地的实战路线图
  • Linux内核信号机制深入解析:高级技巧与进程通信优化
  • 双向广搜
  • 应用现代化 | 金融智能风控的新标尺——《金融级智能应用能力要求 风控场景》标准正式发布
  • 告别 GitHub Copilot?Roo Code 深度上手指南:从API配置到实战,打造你的 AI 编程私有云
  • Lottie-Web终极指南:零代码实现专业级Web动画
  • GKD自动化终极指南:告别重复点击,让手机更智能 [特殊字符]