关于复现此版本的MTCNN遇到的一个错误
我在复现这个版本的时候,我进入到了P_net网络的训练这一步,然后运行train_models文件夹中的train_PNet.py这个脚本的时候,出现了一个麻烦,花了我三天时间解决。
抛出错误如下
ValueError: Shape must be rank 3 but is rank 4 for ‘adjust_hue/Slice’ (op: ‘Slice’) with input shape
解方法如下
进入同文件夹的train.py这个脚本,在84行定义了一个函数如下:
def image_color_distort(inputs):
inputs = tf.image.random_contrast(inputs, lower=0.5, upper=1.5)
inputs = tf.image.random_brightness(inputs, max_delta=0.2)
inputs = tf.image.random_hue(inputs,max_delta= 0.2)
inputs = tf.image.random_saturation(inputs,lower = 0.5, upper= 1.5)
return inputs
这个函数是对图片进行色彩调整的操作,因为调整图像的亮度、对比度、饱和度和色相在很多图像识别中都不会影响识别结果。所以在训练神经网络模型的时候,可以随机调整训练图像的这些属性,从而使训练得到的模型尽可能小的收到无关因素的影响。
然后我经过尝试,把最后的两个inputs对应的两行代码,即:
inputs = tf.image.random_hue(inputs,max_delta= 0.2)
inputs = tf.image.random_saturation(inputs,lower = 0.5, upper= 1.5)
删除掉。
然后函数就不会报错了,虽然少了两个op,但是这两个op对于训练的整体结果不是关键性的,所以影响不大。
具体的原因我也不是很清楚,但是我估计是这两个函数的参数传入有问题,一时半会儿我也找不到,先把解决方法摆在这里,等找出了原因再继续上传原因。
总结
这是自己第一次独立找出了一个bug的解决方法,值得鼓励,但是其实应该很早就能顺藤摸瓜找出来,不需要花费三天的时间,有点儿浪费时间了,所以希望自己以后能够更加耐心一点。
现在继续去完成这个项目的训练。