当训练数据时,如果数据只是一列,而输出也是一列,那就对应着(train,label)输入模型即可。但是如果处理对象是图片时,应该如何将图片作为数据输入模型。我只记录到目前为止的理解作为参考,后续还会修改(应该会的吧!)
一、对图片的结构的了解
图片分成了彩色图和非彩色图:
彩色图,我们用python中任意一个可以读入图片的函数读入查看,可以得到彩色图的维度是(H,W,channel=3)
非彩色图,我认为可以分为灰度图和黑白图,非彩色图他们都只有二维,即(H,W),我原本以为会有一个channel=1,后来发现并木有。灰度图是(H,W)维的0~255的数值,而黑白图除了0就是255,没有别的其他值(哦,顺便提一句,H是height,W是width,channel是颜色通道)
在这里,我想要着重的对mask图(也就是image对应的label)进行分析,我们输入的image就是良民,没什么特殊的。但是我们输入的mask图却有的不太对劲:
如果是二分类问题,那么mask图应当是二值的,如果二值指的是0和255,那么画面就十分和谐了,就像我们常规认识的那样:


如果是多分类问题,当我们输下左边图一的照片时,在我的印象中应该对应的mask是一个美美的就像图二有木有,
但是实际的图是个什么玩意,居然全是黑的图三!!(于是我一度认为这个数据集是坏的)

