自制数据训练yolov3模型
1、制作数据集
数据集的来源主要有以下两个途径
1)搜索网上已有的相关数据集
2)使用网络爬虫技术获取图片库的数据
2、数据集标注
数据集收集完毕之后要做的就是按照自己要做的项目要求对图片进行标注,方法如下:
1)安装标注工具labelimg(以windows为例,前提是有anaconda)
①下载labelimg工具包
②打开cmd或者Anaconda Prompt ,cd 到labelImg的所在路径并进入
③执行如下代码便可打开labelImg界面
conda install pyqt=5
conda install -c anaconda lxml
#注意,第二次想要打开labelimg界面的时候只需要执行下面两步就行
pyrcc5 -o libs/resources.py resources.qrc
python labelImg.py
具体方法可参见:https://github.com/heartexlabs/labelImg
2)使用labelImg进行数据标注
①修改predfined_classes.txt里面的类别信息
打开./labelImg-master/data/predfined_classes.txt,修改成需要模型识别的类型并保存
②labelimg的页面如下所示,主要关注三个位置,打开目录,改变存放路径已经yolo格式的选择,再开始标注前需要设定这三个参数
yolo的的格式主要是以下两种:
第一种:Pascal VOC 对应的.json格式
该格式需要转换为txt格式才会用于yolo模型的训练
第二种:YOLO对应的.txt格式
第一列对应的是对象的label属性,后面是归一化之后的坐标
③使用快捷键在labelImg里面进行标注
a.使用大写字母W创建标注区块并选择标签
b.标注完之后Ctrl+S保存,然后大写字母D就可以进行下一张标注
3、模型训练
1)数据集划分
新建一个文件夹xx,里面包含三个文件夹,一个是Annotations,里面存放所有的标注结果即txt文件,一个是JPEGImages,里面存放所有的标注jpg图片,最后一个是ImageS