mmdetection训练过程
一、训练流程
关于安装,首先参考官网教程安装mmdetetion环境,过程中还是有很多问题:
- CUDA安装;
- Anaconda安装;
- Python安装,这里主要是Python3.7以上版本一致性;
- mmd环境安装,这里面是保证CUDA、Python、mmcw等一致性。
完成了mmd环境搭建,可以尝试跑一下demo。 - 安装库的时候如果源有问题,可以下载whl安装,最好是在conda下安装。
完成了Demo,验证了环境,接下来就可以跑一下标准数据集VOC和COCO,由于COCO文件太大,我只在VOC上验证通过:
数据集完成了,也基本上熟悉了训练和测试的流程。接下来就开始根据实际应用编写自己的数据集和模型了。
这里我们采用labelme进行数据标注,转化为COCO数据集,这里修改一些内容,包括:
5. 安装labelme;
6. prepare_detection_dataset 里 python labelme2coco.py。
7. 在COCO数据集下:
8. 调用数据集:coco.py修改CLASSES;class_names修改coco_classes;faster_rcnn_r50_fpn_1x.py中的model字典中的num_classes、data字典中的img_scale和optimizer中的lr(学习率);等。
9. 完成了数据集配置,接下来开始训练,这里调用:
python tools/train.py configs/faster_rcnn/faster_rcnn_r50_fpn_1x_coco.py --gpus 1 --work-dir work_dirs
- 测试调用:
python tools/test.py work_dirs/faster_rcnn_r50_fpn_1x_coco.py work_dirs/epoch_1.pth --out ./result/result_100.pkl --eval bbox --show
训练时间太短,检测评价矩阵置信度较低:
Log Analysis
python tools/analysis_tools/analyze_logs.py plot_curve --keys bbox_mAP_s --title www --legend loss_cls --out work_dirs/www work_dirs/20210215_213743.log.json
二、环境搭建
Anaconda安装:
https://blog.youkuaiyun.com/qq_15192373/article/details/81091098
Python3.7安装:
https://websiteforstudents.com/installing-the-latest-python-3-7-on-ubuntu-16-04-18-04/
conda配置
https://mirrors.bfsu.edu.cn/help/anaconda/
mmdetection环境搭建
https://blog.youkuaiyun.com/deeplearningfeng/article/details/105554547
Pytorch
https://pytorch.org/get-started/locally/
三、遇到问题
ERROR: Command errored out with exit status 1: /home/one/Downloads/yes/envs/open-mmlab/bin/python3.7 -u -c ‘import sys, setuptools, tokenize; sys.argv[0] = ‘"’"’/tmp/pip-install-bluuo5ne/mmcv-full_85a4a5b41dc54dd081c10df2b403f515/setup.py’"’"’; file=’"’"’/tmp/pip-install-bluuo5ne/mmcv-full_85a4a5b41dc54dd081c10df2b403f515/setup.py’"’"’;f=getattr(tokenize, ‘"’"‘open’"’"’, open)(file);code=f.read().replace(’"’"’\r\n’"’"’, ‘"’"’\n’"’"’);f.close();exec(compile(code, file, ‘"’"‘exec’"’"’))’ install --record /tmp/pip-record-5ebrexyq/install-record.txt --single-version-externally-managed --compile --install-headers /home/one/Downloads/yes/envs/open-mmlab/include/python3.7m/mmcv-full Check the logs for full command output.
解决方法:
conda install pytorch cudatoolkit=10.1 torchvision -c pytorch
pip install -e .
版本问题。
CUDA版本问题:
重新安装cuda10.1解决
https://blog.youkuaiyun.com/martinkeith/article/details/102364284?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.control
https://www.pianshen.com/article/62312040798/
https://blog.youkuaiyun.com/sss_369/article/details/94591280
https://www.jianshu.com/p/fd0f84f858f8
mmcv是通过下面方法安装成功:
git clone https://github.com/open-mmlab/mmcv.git
cd mmcv
MMCV_WITH_OPS=1 pip install -e . # package mmcv-full will be installed after this step
cd …
https://blog.youkuaiyun.com/qq_40092110/article/details/108165868
遇到下载出错的,可以直接下载whl文件
pip install *.whl
conda create -n open-mmlab python=3.7 -y
ipython和python版本不一致:
先使用python
四、参考文章
https://blog.youkuaiyun.com/gaoyi135/article/details/90613895
https://blog.youkuaiyun.com/syysyf99/article/details/96574325