VOC格式数据集操作类构建-5.根据train.txt分离数据集

该博客介绍了如何利用train.txt文件将VOC格式的数据集划分为训练集和测试集。通过VOC类库和相关操作函数,实现了根据ImageSets/Main目录下的train.txt文件,将数据集的图像和标注文件分别存储到不同的目录中,便于后续的训练和验证。提供了GitHub项目链接和详细使用说明。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

总目标:建立VOC格式数据集类以及操作函数库

VOC类库存储在VOC.py中,单个xml文件操作函数库存储在VOCOperationLibrary.py

VOC类import VOCOperationLibrary as vol

github项目地址(附有使用说明书):

https://github.com/A-mockingbird/VOCtype-datasetOperation

 

Day5.根据train.txt分离数据集

内容:

根据VOC数据集格式目录中ImageSets/Main/路径下train_val.txt或train.txt文件。

将数据集中的图片和标注文件分离为训练集和测试集不同文件中。

输入:

taintxt:train.txt或train_val.txt文件路径

savedir:分离后数据集存储目录

annodir:数据集标注文件目录

imgdir:数据集图像文件目录

    def _Splitdataset(self, traintxt, savedir, annodir=None, imgdir=None):
        """
        Split the dataset into train set and test set, according the train.txt.
        Precondition:
                    traintxt:train.txt which include the train set file name
                    savedir:save direction
 
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值