YOLOv3(keras)训练自己的voc数据集
最近在学习YOLOv3,现在简单的写一篇博客来分享一下自己训练数据集的过程,顺便算是记录一下工作进度和,希望能和大家共同探讨。
一.操作系统及环境
操作系统:windows10
环境:tensorflow-gpu keras-gpu spyder
二.运行测试
首先在 https://github.com/qqwweee/keras-yolo3 上下载好相关代码,然后在YOLO官网上下载预先训练好的权重文件并放置在代码主文件夹内;(下载地址:https://pjreddie.com/media/files/yolov3.weights) 然后使用以下命令来转化权重文件:
python convert.py yolov3.cfg yolov3.weights model_data/yolo.h5
转化结果完成如下图所示:
最后使用以下命令来运行测试(单张图像):
python yolo_video.py --image
随便找了一张图,结果居然不是很好?!
三.数据集准备
在代码文件夹内建立名为VOCdevkit的文件夹并且包含以下子文件夹,具体菜单结构及命名如下图所示:
下载labelmg工具(https://github.com/tzutalin/labelImg) 来制作制作数据集的标签文件。图片放在JPEGImages文件夹内,标签文件存储在Annotations文件夹内。需要注意:图像的w可以和h不相等但都必须是32的倍数,(64x64,128x128…)。
标注工作完成后,在VOC2007文件夹下建立txt.py并运行,代码如下:
import os
import random
trainval_percent = 0.2
train_percent = 0.8
xmlfilepath = 'Annotations'
txtsavepath = 'ImageSets\Main'
total_xml = os.listdir(xmlfilepath)
num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)
ftrainval = open('ImageSets/Main/trainval.txt', 'w')
ftest = open('ImageSets/Main/test.txt', 'w')
ftrain = open('ImageSets/Main/train.txt', 'w')
fval = open('ImageSets/Main/val.txt', 'w')
for i in list:
name = total_xml[i][:-4] + '\n'
if i in trainval:
ftrainval.write(name)
if i in train:
ftest.write(name)
else:
fval.write(name)
else:
ftrain.write(name)
ftrainval.close()
ftrain.close()
fval.close(