神经网络训练样本制作_VOC格式_FOR_YOLO(Darknet)_AND_PVANet(FasterRCNN)

该博客详细介绍了如何为神经网络训练准备VOC格式的数据集,包括图片采集、标注,以及如何将数据转换为适用于YOLO(Darknet)和PVANet(Faster R-CNN)的训练格式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.采集好图片,给图片做标注:

给图片进行统一重命名,裁剪,调整分辨率,做旋转镜像等增强,都可以用美图秀秀批量处理小程序。

这里有个特别好用的一个图片标注工具“labelimge”,下载使用教程参考博客:  http://blog.youkuaiyun.com/zzzzzzz0407/article/details/70267163

标注好后,会得到每张图片对应的xml文件。

2.yolo训练数据

包括train和validate。train包括:trainImageId.txt (图片名列表),trainImgePath.txt (图片路径列表),trainImage(所有图片和用脚本将xml转化出的txt标签,对yolo要吧每张图片标签的xml转化成txt);validate同理。
把脚本和Imgae,标签ImageXML放在同一目录下,运行脚本(先traindata.py 后trans.py)会自动生产所需的文件。然后手动把trainlabeltxt的所有文件考到trainimge里,val同理。
脚本:链接: https://pan.baidu.com/s/1dFw0ZTZ 密码: fnfv
训练时可能出现的问题
无法打开图片
1.python编码问题,把imgaepath.txt里的内容,拷贝到一个新的txt里替换原来的就好。
2.如果是trainimage/valimage里的图片无法正常打开浏览,把原图过去替换就好。
**[注]在使用trans.py时注意修改要检测的目标类别**

3.pvanet训练数据

结构:VOC2007目录下三个文件夹: Annotations(每张图片的标签.xml),JPEGImages(图片.jpg), ImageSets文件夹。
ImageSet保留Main:train.txt,trainval.txt,val.txt即可。(图片名列表)
运行下面的代码,手动把图片名拷贝到Main里的三个txt文件里。
    # -*- codi
### 使用YOLO进行VOC2007数据集的训练 #### 准备环境和依赖项 为了成功运行YOLO并完成训练过程,需先设置好所需的软件环境。这通常涉及安装操作系统(如CentOS 7)、编译器工具链以及必要的库文件,比如OpenCV和Darknet框架本身[^2]。 #### 获取与预处理数据集 针对特定版本的数据集——即VOC2007训练集,应从官方资源获取对应的`.tar`压缩包[VOCtrainval_06-Nov-2007.tar][^1]。下载完成后通过命令行解压该档案至指定位置,并调整路径使得后续脚本能够访问这些图像及其标注信息。对于简化操作流程而言,可以考虑将提取出来的`VOCdevkit`文件夹放置于`darknet/scripts/`子目录内以便直接调用现有的转换脚本而无需额外编辑[voc_label.py](https://github.com/AlexeyAB/darknet/blob/master/scripts/voc_label.py)。 #### 修改配置参数适应自定义需求 考虑到可能存在的硬件性能差异或其他个性化考量,在实际执行之前应当适当裁剪待使用的样本范围。具体做法是在`voc_label.py`源码中定位到负责迭代不同年份及分割类型的列表变量`sets[]`,仅保留适用于当前场景下的组合[(‘2007’, ‘train’), (‘2007’, ‘val’)]。 #### 启动模型训练进程 当一切准备就绪之后,即可利用预先设定好的超参数启动YOLO v3模型的学习任务。在此期间会监控两个主要指标:一个是基于训练批次计算得出的即时误差(`Train loss`);另一个则是依据独立测试集合评估所得的整体表现(`Test loss` 或 `val_loss`)[^3]。这两个数值的变化趋势有助于判断算法收敛情况以及是否存在过拟合风险等问题。 ```bash ./darknet detector train cfg/voc.data cfg/yolov3-voc.cfg yolov3.weights -dont_show ``` 上述命令假设读者已经处于Darknet项目的根目录之下,并且拥有正确的配置文件(.cfg,.data)连同初始权重(.weights),其中`yolov3-voc.cfg`为经过适配后的网络架构描述文档,而`voc.data`则包含了指向各类别名称、图片清单等重要元数据的信息表单。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值