
CRNN图像序列预测
文章平均质量分 52
基于卷积循环神经网络,做一个图像序列的预测。包括模型介绍、如何加载自己的数据集、训练过程和遇到的常见错误
hnu_zzt
这个作者很懒,什么都没留下…
展开
-
python将图片按照标签分类复制到指定的文件夹
对文件夹test下的图片进行kmeans聚类之后(这里我将k设为7),得到一个txt文件。txt文件中有两列数据,第一列是对应图片属于的类别,第二列是该图片距离质心的距离。如图所示:现在我新建了0到6七个文件夹,然后将图片按照类别复制到不同文件夹下,详细代码如下:import numpy as npimport osimport shutil# 读取txt文件并将其转化为array...原创 2018-12-07 19:10:14 · 7125 阅读 · 1 评论 -
将文件夹下的所有图片从RGB空间转换到HSI空间
RGB转HSI,python实现RGB为图片最基本的特征,但很多时候RGB颜色空间并不能很好的作为图片聚类的聚簇依据,通常不符合人们对颜色相似性的主观判断。HSI色彩空间是从人的视觉系统出发,用色调(Hue)、色饱和度(Saturation或Chroma)和亮度 (Intensity或Brightness)来描述色彩。HSI色彩空间可以用一个圆锥空间模型来描述。用这种 描述HIS色彩空间的圆锥...原创 2018-12-07 12:24:46 · 2269 阅读 · 1 评论 -
kmeans对自己的图像数据集聚类(及肘部法求最佳K值)
python实现kmeans(自己的图像数据集)上篇笔记已经介绍了,如何加载自己的图像数据集。这篇笔记介绍对自己的图像数据集用kmeans聚类。为了方便演示,我的数据集是100张36464的彩色图片,均放在test文件夹下。只需修改下文件夹路径就可以实现。详细代码和注释如下:import torchfrom torch.utils import datafrom PIL import Im...原创 2018-12-04 14:32:54 · 14264 阅读 · 8 评论 -
基于crnn图像序列预测-pytorch代码实现——训练过程及常见错误
在这里主要介绍三种模型,包括简单的一层卷积层的conv1_LSTM,以及卷积部分迁移学习VGG和RESNET模型的VGG_LSTM,RESNET_LSTM。常见错误:1、报错:size mismatch,如下图,报这样的错误是应为卷积层与层之间的维度不匹配。要明确每一步的输入输出的size。...原创 2019-01-22 10:55:23 · 4862 阅读 · 3 评论 -
基于crnn图像序列预测-pytorch代码实现——模型介绍
在这里介绍卷积循环网络模型,包括简单的一层卷积层的conv1_LSTM,以及卷积部分迁移学习VGG和RESNET模型的VGG_LSTM,RESNET_LSTM。关键在于层与层之间的size match,将卷积部分提取的特征作为LSTM输入的seq_len。需要注意的是,VGG和RESNET网络特征层输入的尺寸都是51277,所以LSTM的input_size=512 * 7 * 7CONV_L...原创 2019-01-22 10:55:15 · 6071 阅读 · 4 评论 -
pytorch一步一步在VGG16上训练自己的数据集
准备数据集及加载,ImageFolder在很多机器学习或者深度学习的任务中,往往我们要提供自己的图片。也就是说我们的数据集不是预先处理好的,像mnist,cifar10等它已经给你处理好了,更多的是原始的图片。比如我们以猫狗分类为例。在data文件下,有两个分别为train和val的文件夹。然后train下是cat和dog两个文件夹,里面存的是自己的图片数据,val文件夹同train。这样我们的...原创 2018-12-19 11:32:04 · 33475 阅读 · 35 评论 -
pytorch加载自己的图像数据集
深度学习笔记(1)——加载自己的图像数据集之前学习深度学习算法,都是使用网上现成的数据集,而且都有相应的代码。到了自己开始写论文做实验,用到自己的图像数据集的时候,才发现无从下手 ,相信很多新手都会遇到这样的问题。参考博文https://blog.youkuaiyun.com/TH_NUM/article/details/80877196,在此感谢博主!下面代码实现了从文件夹内读取所有图片,进行归一化和标...原创 2018-12-03 15:12:12 · 21746 阅读 · 22 评论 -
基于crnn图像序列预测-pytorch代码实现——加载自己的数据集
**任务介绍:**在这里基于卷积循环神经网络,做一个图像序列的预测。图像序列中每一张图像对应三个状态标签的一个。利用卷积网络对每连续的九张图像进行特征提取,然后将提取的特征序列输入到循环神经网络(LSTM)中,预测下一张图像状态,再与原本图像序列中的第十张图像计算loss。**数据集介绍:**数据来自两段工业视频(一段训练,一段测试),将视频按帧提取图像序列(在时间上连续)。对图像进行标记,分为...原创 2019-01-22 10:55:32 · 8463 阅读 · 5 评论