yolov5训练数据集_yolov5 识别长方体障碍的数据集-优快云博客

今天以熊猫为模板来进行训练数据集

一.打开data中的images文件将里面的图片替换为大熊猫并将名称替换为简写，以便后续输入

并在data文件中新建dataset和labels两个文件夹

再打开命令提示符并以管理员身份运行，激活我们的yolov5环境，并进入我们的文件夹中

2.输入labelimg进入训练页面

然后需要对labelimg进行设置：首先选择自动保存模型

首先选择 Change Save Dir 然后把文件路径选择为dataset文件夹

点击Open Dir 选择文件夹images

选择成功后显示如下并点击方框中的按钮

对图片的主体进行框选

再对其进行标注

标注完一张图片后，点击Next Image，标注下一张图片

剩下的图片进行同样的操作

标注好的图片都会在dataset中

二，接下来就是数据预处理与源代码修改

首先在工程目录文件下新建split.py程序，输入这段代码

import os
import random
import argparse
parser = argparse.ArgumentParser()
parser.add_argument('--xml_path', default='data/dataset', type=str, help='input xml label path')
parser.add_argument('--txt_path', default='data/labels', type=str, help='output txt label path')
opt = parser.parse_args()
trainval_percent = 1.0
train_percent = 0.8
xmlfilepath = opt.xml_path
txtsavepath = opt.txt_path
total_xml = os.listdir(xmlfilepath)
if not os.path.exists(txtsavepath):
os.makedirs(txtsavepath)
num = len(total_xml)
list_index = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list_index, tv)
train = random.sample(trainval, tr)
file_trainval = open(txtsavepath + '/trainval.txt', 'w')
file_test = open(txtsavepath + '/test.txt', 'w')
file_train = open(txtsavepath + '/train.txt', 'w')
file_val = open(txtsavepath + '/val.txt', 'w')
for i in list_index:
name = total_xml[i][:-4] + '\n'
if i in trainval:
file_trainval.write(name)
if i in train:
file_train.write(name)
else:
file_val.write(name)
else:
file_test.write(name)
file_trainval.close()
file_train.close()
file_val.close()
file_test.close()

运行此段代码无误后，然后以同样的方式再创建xml_to_txt.py文件并运行，文件代码如下

import xml.etree.ElementTree as ET
from tqdm import tqdm
import os
from os import getcwd
sets = ['train', 'val', 'test']

classes = ['xm1', 'xm2','xm3','xm4'] # 这里改为你要训练的标签，否则会报错。比如你要识别“xm”，那这里就改为xm
def convert(size, box):
dw = 1. / (size[0])
dh = 1. / (size[1])
x = (box[0] + box[1]) / 2.0 - 1
y = (box[2] + box[3]) / 2.0 - 1
w = box[1] - box[0]
h = box[3] - box[2]
x = x * dw
w = w * dw
y = y * dh
h = h * dh
return x, y, w, h

def convert_annotation(image_id):
# try:
in_file = open('data/dataset/%s.xml' % (image_id), encoding='utf-8')
out_file = open('data/labels/%s.txt' % (image_id), 'w', encoding='utf-8')
tree = ET.parse(in_file)
root = tree.getroot()
size = root.find('size')
w = int(size.find('width').text)
h = int(size.find('height').text)
for obj in root.iter('object'):
difficult = obj.find('difficult').text
cls = obj.find('name').text
if cls not in classes or int(difficult) == 1:
continue
cls_id = classes.index(cls)
xmlbox = obj.find('bndbox')
b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
float(xmlbox.find('ymax').text))
b1, b2, b3, b4 = b
# 标注越界修正
if b2 > w:
b2 = w
if b4 > h:
b4 = h
b = (b1, b2, b3, b4)
bb = convert((w, h), b)
out_file.write(str(cls_id) + " " +
" ".join([str(a) for a in bb]) + '\n')
# except Exception as e:
# print(e, image_id)

wd = getcwd()
for image_set in sets:
if not os.path.exists('data/labels/'):
os.makedirs('data/labels/')
image_ids = open('data/labels/%s.txt' %
(image_set)).read().strip().split()
list_file = open('data/%s.txt' % (image_set), 'w')
for image_id in tqdm(image_ids):
list_file.write('data/images/%s.jpg\n' % (image_id))
convert_annotation(image_id)
list_file.close()
在进行输入时，请将数据集等信息修改为自己所存储的一样，避免报错。

接下来在data文件夹中新建myvoc.yaml文件，输入这段代码，这里一定要注意一点在train,val,nc,names冒号后面一定要空一格，要判断正确不正确，只要看这几个关键字有没有变颜色，要是变颜色那就说明是正确的。

最后再修改models下的yolov5s.yaml文件，将nc：80改成nc：1即可

至此，我们就完成了数据预处理以及代码的修改

然后输入命令：python train.py --batch-size 8 --epochs 10 进行训练，如果出现内存不足的错误，将batch后面的4进一步改小避免训练的数据量过大，电脑卡顿