运行环境,Ubuntu16.04 + CUDA 8 + cuDNN6 + Opencv3.1
Windows10 +MSVS2015+CUDA 9.1 + cuDNN7 + Opencv3.1
Ubunutu环境下按照以下网址安装并配置好Darknet :
https://pjreddie.com/darknet/install/
Windows10环境下按照以下网址安装并配置好Darknet (若用上面的链接下载需要自行修改代码才能在windows跑起来,已经有大神帮我们修改好了):
https://github.com/AlexeyAB/darknet#how-to-compile-on-windows
数据集下载链接:百度网盘,提取密码:gorp
先放效果:
1.构建VOC数据集
1.1准备工作
进入到darknet/scripts目录下,建立如下文件夹结构:
目录Annotation:存放xml文件,每一个xml对应一张图像,文件中存放的是标记的各个目标的位置和类别信息。后面会讲到如何生成;
目录ImageSets:暂时可以不用管;
目录JPEGImages:文件夹中放自己的数据集,jpg格式,命名方式000001.jpg、000002.jpg……以下是我自己的数据集,500+图片
1.2 标记图像
因为做的是目
标检测,所以接下来需要标记原始图像中的目标区域。这里需用
labelImg
,
工具地址见GitHub:
https://github.com/tzutalin/labelImg
,详细用法见
GitHub
w——开始画框