
机器学习
ssuqin001
特立独行
展开
-
YOLOv5继续训练【断点续传】
项目场景: YOLOv5训练了很久突然发现中断了心态爆炸,重新训练浪费时间,万一再中断呢。 想起来之前YOLOv3可以根据log继续训练,所以YOLOv5是不似乎也可以呢! 抱着试一试的想法去csdn和百度上翻了半天都是YOLOv5训练数据的保姆级教程,心塞塞… 不过功夫不负有心人 终于解决了!Mark一下。 问题描述: YOLOv5训练500epoch,速度异常缓慢,30个小时才不到200次还中断了。。。 如何能够断点续传呢? 解决方案: Pytorch里有一个resume功能,YOLOv5是基转载 2021-11-08 20:13:53 · 2413 阅读 · 1 评论 -
深度学习中的epochs,batch_size,iterations详解---对这三个概念说的比较清楚
深度学习框架中涉及很多参数,如果一些基本的参数如果不了解,那么你去看任何一个深度学习框架是都会觉得很困难,下面介绍几个新手常问的几个参数。 batch 深度学习的优化算法,说白了就是梯度下降。每次的参数更新有两种方式。 第一种,遍历全部数据集算一次损失函数,然后算函数对各个参数的梯度,更新梯度。这种方法每更新一次参数都要把数据集里的所有样本都看一遍,计算量开销大,计算速度慢,不支持在线学习,这称为Batch gradient descent,批梯度下降。 另一种,每看一个数据就算一下损失函数,然后求转载 2021-10-28 15:10:40 · 327 阅读 · 0 评论 -
RuntimeError: Unable to find a valid cuDNN algorithm to run convolution
cuda和cudnn安装完后, 运行程序显示报错 RuntimeError: Unable to find a valid cuDNN algorithm to run convolution 在把cudnn几个版本装了卸,卸了装之后,尝试把batch_size改小,从64改到24,训练正常运行了...... ......为啥子提示不能完整点.... 本文转载自:http://events.jianshu.io/p/75f901f94fee ...转载 2021-10-25 15:03:20 · 8715 阅读 · 2 评论 -
Ubuntu系统下查看安装的CUDA和CUDNN的版本
一、查看 CUDA 版本: 进入到根目录下: cat /usr/local/cuda/version.txt 我的是9.0.103 二、查看 CUDNN 版本: cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2 我的是7.0.1 本文转载自:https://www.cnblogs.com/taoyuyeit/p/11233622.html ...转载 2021-10-21 21:09:27 · 2240 阅读 · 0 评论