问题:
在使用tf.image.convert_image_dtype方法将一个uint类型的tensor转换为float类型时,该方法会自动对数据进行归一化处理,将数据缩放到0-1范围内,如果没有注意到这点,之后在进行网络训练时会发现网络不收敛、不训练。
示例:
1、读取图像数据并显示

可以看到当前的数据类型为int,范围在0-255之间
2、使用tf.image.convert_image_dtype转换数据类型为float

可以看到经过转换后的数据范围在0-1之间,而且图像数据显示还是正常的,说明虽然进行了数据归一化,但是并没有破坏图像数据包含的信息。
这里需要注意的是,该方法已经对数据做了归一化处理,如果没有意识到这点,在训练网络时,如果再次进行归一化则会出现网络训练不收敛的情况。
解决办法:
1、使用tf.cast方法转换数据类型为float

可以看到此时数据类型已经转换为float,而且数据范围没有发生变化。(上面将数据转换为int32只是为了能够使用matplotlib进行图像显示)
2、将tensor转换为numpy数据,然后再转换numpy数组的类型
这里给出tensor和numpy数组想混转化的方法:

本文解析了在TensorFlow中使用tf.image.convert_image_dtype方法将uint类型tensor转换为float类型时,该方法自动进行归一化的潜在问题。若未注意到此点,在网络训练时可能出现不收敛现象。文章提供了两种解决方案:使用tf.cast方法转换数据类型或先将tensor转换为numpy数据再转换类型。
5433

被折叠的 条评论
为什么被折叠?



