YOLOv3训练自己的VOC数据(一)——前期准备工作

本文介绍了如何使用YOLOv3训练自定义的VOC数据集。首先,从官方下载darknet和VOCdevkit并验证运行。接着,创建与XML标注对应的JPEGImages和Annotations文件夹,利用LabelImage工具或Python脚本转换标注文件。然后,生成ImageSet的train、test、val和traval.txt文件。最后,将所有文件放入darknet目录,修改voc_label.py以适应自定义类别,并运行生成训练所需的txt文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

yolo官网 https://pjreddie.com/darknet/yolo/

  1. 下载darknet 以及VOCdevkit 按官网跑通
  2. 准备自己的VOC数据集,可以在本地先建立一个如下格式的文件夹
    /text/aHR0c

JPEGImages和Annotations中文件名是相互对应的 如 1.jpg对应的标注是1.xml

可以使用LabelImage工具快捷生成xml文件
也可以将原本已标注的1.txt通过代码转换为1.xml
假设你原本有一个标注好的1.txt 它里面每一行的内容为“数字1 数字2 数字3 数字4 类别”
你可以使用如下的python代码将txt格式转化为xml。
label.py


#! /usr/bin/python
# -*- coding:UTF-8 -*- 

import os, sys
import glob
from PIL import Image

src_img_dir = 'D:\\study\\xmu\\design\\VOC\\JPEGImage'

src_txt_dir = 'D:\\study\\xmu\\design\\VOC\\label'
src_xml_dir ='D:\\study\\xmu\\design\\VOC\\Annotations'
 
img_Lists = glob.glob(src_img_dir + '/*.png')
 
img_basenames = [] # e.g. 100.jpg
for item in img_Lists:
    img_basenames.append(os.path.basename(item))
 
img_names = [] # e.g. 100
for item in img_basenames:
    temp1, temp2 = os.path.splitext(item)
    img_names.append(temp1)
 
for img in img_names:
    im = Image.open((src_img_dir + '/' + img + '.png'))
    width, height = im.size
 
    # open the crospronding txt file
    gt = open(src_txt_dir + '/' + img + '.txt').read().splitlines()
    #gt = open(src_txt_dir + '/gt_' + img + '.txt').read().splitlines()
 
    # write in xml file
    #os.mknod(src_xml_dir + '/' + img + '.xml')
    xml_file = open((s
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值