源码:https://github.com/matterport/Mask_RCNN
主要问题:Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR和
tensorflow.python.framework.errors_impl.UnknownError: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
[[{
{node conv1/convolution}}]]
[[{
{node mrcnn_detection/map/TensorArrayUnstack/range}}]]
一、环境配置
本来是打算tensorflow-gpu1.13.1+cuda10.1+cudnn7.5+keras,这些都是当前最新版本,配置好了后发现tensorflow1.13.1暂且不支持cuda10.1,故而换成了cuda10.0,依然报错,这里注意cudnn也要更换,我是换成了支持cuda10.0的cudnn7.5,然后运行demo,可以直接jupyter notebook中运行demo.ipynb,也可以导出成demo.py然后终端或者其它IED执行,我习惯使用终端,而且终端和jupyter notebook运行提示情形可能有详略之分,不过需要注意的是,导出的demo.py需要注释掉一行代码:get_ipython().run_line_magic('matplotlib', 'inline')。有一些依赖项需要安装,在requirements.txt中,还有其它文件需要下载,预训练的权重文件mask_rcnn_coco.h5(https://github.com/matterport/Mask_RCNN/releases),pycocotools文件(https://github.com/waleedka/coco),在PythonAPI目录下,如果使用python3这里需要修改Makefile中的python为python3,倘若默认python就是python3,那倒不必修改,总之要注意版本的对应,make运行Makefile后,会在pycocotools目录下生成一个_mask文件,这个就是程序所需要的pycocotools._mask,然后把pycocotools目录复制到samples/coco下,倘若运行demo的时候报错缺少这个模块,那么就是这方面有问题,要么是没有复制到指定位置,要么是没有make,要么是make生成的文件版本不一致,关于版本不一致需要注意(后面会提到)。
二、运行
在此环境下,我运行demo时结果如下:
Using TensorFlow backend.
Configurations:
BACKBONE resnet101
BACKBONE_STRIDES [4, 8, 16, 32, 64]
BATCH_SIZE 1
BBOX_STD_DEV [0.1 0.1 0.2 0.2]
COMPUTE_BACKBONE_SHAPE None
DETECTION_MAX_INSTANCES 100
DETECTION_MIN_CONFIDENCE 0.7
DETECTION_NMS_THRESHOLD 0.3
FPN_CLASSIF_FC_LAYERS_SIZE 1024
GPU_COUNT 1
GRADIENT_CLIP_NORM 5.0
IMAGES_PER_GPU 1
IMAGE_CHANNEL_COUNT 3
IMAGE_MAX_DIM 1024
IMAGE_META_SIZE 93
IMAGE_MIN_DIM 800
IMAGE_MIN_SCALE 0
IMAGE_RESIZE_MODE square
IMAGE_SHAPE [1024 1024 3]
LEARNING_MOMENTUM 0.9
LEARNING_RATE 0.001
LOSS_WEIGHTS {'rpn_class_loss': 1.0, 'rpn_bbox_loss': 1.0, 'mrcnn_class_loss': 1.0, 'mrcnn_bbox_loss': 1.0, 'mrcnn_mask_loss': 1.0}
MASK_POOL_SIZE 14
MASK_SHAPE [28, 28]
MAX_GT_INSTANCES 100
MEAN_PIXEL [123.7 116.8 103.9]
MINI_MASK_SHAPE (56, 56)
NAME coco
NUM_CLASSES 81
POOL_SIZE 7
POST_NMS_ROIS_INFERENCE 1000
POST_NMS_ROIS_TRAINING 2000
PRE_NMS_LIMIT 6000
ROI_POSITIVE_RATIO 0.33
RPN_ANCHOR_RATIOS [0.5, 1, 2]
RPN_ANCHOR_SCALES (32, 64, 128, 256, 512)
RPN_ANCHOR_STRIDE 1
RPN_BBOX_STD_DEV [0.1 0.1 0.2 0.2]
RPN_NMS_THRESHOLD 0.7
RPN_TRAIN_ANCHORS_PER_IMAGE 256
STEPS_PER_EPOCH 1000
TOP_DOWN_PYRAMID_SIZE 256
TRAIN_BN False
TRAIN_ROIS_PER_IMAGE 200
USE_MINI_MASK True
USE_RPN_ROIS True
VALIDATION_STEPS 50
WEIG