当前位置: 首页 > news >正文

YOLO系列学习三(训练):

!!!如何让训练跑的更快:

一.训练效率:即下面四种硬件资源的利用率

二.两个高效率训练的典型特征:

-cuda的利用率又高又稳

-所有资源利用率都不到100%

三.影响GPU训练效率的4个选项:

1.imgsz选项--->缩放

注:imgsz必须是32的倍数

例如:imgsz=640,就是将图片缩放到一个640×640的正方形里,图片的宽高比例不变

到目前为止的训练的完整流程:

重点:

-imgsz越小,训练越快,但是也是有上限的,并且还与训练效果有关

-Imgsz设置成多少比较合适:一般保持默认的640就行

-比较建议调整的情况有两种:

1.图片尺寸很大,目标一丁点---->imgsz调高一点

2.图片尺寸普遍比640小---->保持原本(接近)的32倍的imgsz

2.batch选项---->批次

一个批次里图片的数量:批量(batch size)

代码里将"batch=2",一次投喂两张图片

硬件条件会限制batch的上限

batch=2 时间:大概42s

batch=8 时间:大概22s

(1)batch对显存占用和训练效率的影响:

-batch太小,显存占用低,训练效率低

-随着batch越调越高,显存占用会变高,训练效率也会变高,但是效率的提升是有限的

-尤其是显存占用快满的时候,效率反而会变差

-batch再高的话,甚至会开始报错

(2)接近最快的batch一般是在一个区间里,我们只需要将batch调整到这个区间就行

方法:将"batch=-1",YOLO就会自动帮你找一个相对合适的batch,调到能差不多接近最快就行

3.cache选项---->缓存

默认cache=False,即不适用缓存

对应cache="ram",即使用内存作为缓存

缓存的核心思想:如果一个东西你经常用,就放到近一点的地方

所有训练集图片都以文件的形式存储下硬盘里,每次训练时,都需要将图片从硬盘加载到内存里,再进行后续操作

cache="ram",提前加载,提前缩放(大概率可以提高训练的效率)

缺点:所有缩放后的图片都会放到 内存里,所以内存要足够大,才能容纳这些图片

4.workers选项---->打包

细节:

-每一轮的每个批次都是随机打包的

-在把每批次的图片拼到一个数据块之前,通常会先随机修改一下

数据增强(修改)----随机放大或缩小一些,接着随机旋转一点角度,再调一调颜色,再从中间裁剪一下

一个批次完整的打包流程:

解决办法:多开几个进程打包:

"worker=1",时间:大概12s

worker每加一,内存就要多消耗一倍

5.邪修路线:

http://www.cnnetsun.cn/news/117132.html

相关文章:

  • 前沿速递 | Adv. Eng. Mater.:基于LPBF与压力渗透的FeSi2.9-Bakelite多功能复合材料设计与性能调控
  • Mermaid Live Editor 终极指南:实时图表编辑的完整解决方案
  • Drawnix白板工具:用代码思维重塑图形设计工作流
  • Monaco Editor代码提示响应优化实战指南
  • 下一代前端开发:用Next.js与大模型AI,零代码解锁你的智能助手
  • 跨越浏览器壁垒:Skyvern如何实现自动化脚本的通用兼容性
  • 应用现代化 | 金融智能风控的新标尺——《金融级智能应用能力要求 风控场景》标准正式发布
  • Undetectable接入亮数据代理ip做自媒体矩阵
  • 如何用lidR包3步完成激光雷达林业精准分析:从点云到决策的完整指南
  • 初识操作系统
  • Android端AI模型部署终极指南:从入门到精通
  • RuoYi-Vue3企业级管理系统:现代化开发框架实战指南
  • MCP协议驱动企业级AI集成:芋道源码的智能化升级实践
  • 终极指南:使用gsplat.js实现高性能3D高斯点云渲染
  • 把CNN和SVR捏在一起做预测这事儿,乍听有点玄乎,实操起来倒挺有意思。咱们今天不整那些虚头巴脑的理论,直接上手撸代码。先甩个模型结构出来镇楼
  • Memobase完整安装指南:构建AI长期记忆系统的7个关键步骤
  • Faiss HNSW性能瓶颈突破:5步诊断与3倍提速优化实战
  • 5个立竿见影的wgpu性能优化技巧:让你的Rust图形应用帧率翻倍
  • 1000 人并发 + 4K 高清,3 大行业案例见证协作效率翻倍
  • 字符串的拼接函数:strcat()
  • GraphRAG-Local-UI终极指南:本地知识图谱构建与智能查询完整教程
  • Messari:Flow 生态 2025 年 Q3 发展概览
  • Draft.js工具栏深度定制:构建企业级富文本编辑器的完整实践
  • 下一个版本EmotiVoice将带来哪些惊喜?
  • 明诺多功能全自动洗地机,适用于超市、地库及商场清洁需求
  • 最近网上爆火的Flowith AI是啥?能否成为下一代AI Agent产品?
  • CesiumJS体素渲染终极指南:3D体积数据可视化完整解析
  • LrcApi终极指南:快速构建专业级歌词同步服务的完整方案
  • DeepSeek-V3.2-Exp推理部署终极指南:从模型文件到生产服务的完整路径
  • CVAT用户权限配置完整教程:从基础到高级的团队协作管理终极指南