首先,先看一下在分割问题中,最常见的one-hot编码直观上是如何进行的,以及是怎样进行preds的
下图(图一),是常见的ground-truth分割图,一共有两个类别(背景可以作为0,不单独作为一个类别)
如果想进行cross-entropy计算损失函数等,就需要对图一的label进行one-hot编码,直观上会变成下图所示(图二)
然后,我们的图片经过神经网络,训练好之后,输出的预测值就会如下图所示(图三)
那么下面,假设有两个class,然后图片的格式是(2,3)即height=rows=2,width=cols=3。
根据一般dense prediction,输出格式类似于:(batch_size, 2, 3, 2)
下面为了简便,省略batch_size这个维度,变成(2,3,2)
假设图片在class0与class1上的预测值分别为
#preds values at class0
0.1 0.3 0.1
0.2