Faster-RCNN训练自己的数据集

最新推荐文章于 2025-07-13 16:33:53 发布

原创

最新推荐文章于 2025-07-13 16:33:53 发布 · 1.9w 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#fasterRCNN #RCNN #VOC2007 #python #数据集

本文介绍了如何使用Python将个人数据集转换为VOC2007格式，以便训练Faster-RCNN。主要内容包括统一图片命名、使用标注工具创建txt文件、生成XML注释文件、制作ImagesSetMain的txt文件，以及解决训练过程中的边界框问题。

就目前我在了解到的资料来看，训练RCNN系列，一般有两种思路：

修改CNN的工程代码，适应自己的数据集格式
将自己的数据格式做成VOC2007形式的数据集

从工作量来看，无疑后者更容易一些，本文的思路也是如此。

首先是图片的命名格式，虽然图片的命名理论上不会影响训练。因为训练的数据都是从txt文件中读取图片的名称。但是为了统一数据集，仍然建议批量、有规律的命名数据图片。

我的数据集是jpg格式，和PASCAL_VOC2007一样。将图片置于同一个文件夹中，然后运行一段python代码即可。

代码见文末
命名之后，就可以进行标注了。我借用了一个网上的标注工具，windows7下运行良好，可惜没放出源码，无法学习交流。
- 标注工具得到了一份标注的集合的txt文件，记录图片和标注信息
上述都是准备工作，然后就可以制作VOC格式的数据集了。总体来看，VOC格式的数据集格式如下：
```
---VOC2007
------Annotations
------ImagesSet
---------Main
-
```

最低0.47元/天解锁文章

新学期VIP享超值加赠

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。