深度学习训练样本库的建立及Matlab实现
深度学习是近年来非常热门的技术,但是很多人往往会忽略深度学习的核心——训练样本。训练的质量与数量直接决定了模型的性能,因此建立自己的深度学习训练样本库是非常重要的。
我们需要两个训练样本库,一个是分类识别数据库,另外一个是目标检测数据库。下面将分别介绍如何建立这两个样本库以及如何使用Matlab实现。
一、分类识别数据库的建立
- 数据的采集
首先我们需要收集大量符合我们需求的图片作为训练数据,可以通过网络搜索和自己拍摄等方式得到。
- 图片的标注
在深度学习中,我们需要为每一张图片标注其所属的类别。常见的方式是对于已经分好类的图片进行手动标注,使用工具像LabelImg或者VGG Image Annotator等。
- 数据的预处理
对于深度学习,我们需要将图片缩放至相同大小,并进行归一化处理,这样可以更好地训练模型。同时尽可能清除噪声,增加训练数据的可靠性。
- 数据的存储
最后,我们将处理过的数据保存在指定的文件夹中,命名规则与标注一致,方便后续训练与测试数据的调用。
二、目标检测数据库的建立
- 数据的采集
同样地,我们需要收集大量包含目标物体