Pytorch中BCELoss和BCEWithLogitsLoss的差别
BCELoss
在图片多标签分类时,如果3张图片分3类,会输出一个3*3的矩阵。

先用Sigmoid给这些值都搞到0~1之间:

假设Target是:

BCELoss是−1n∑(yn×lnxn+(1−yn)×ln(1−xn))-\frac{1}{n} \sum(y_n \times lnx_n + (1-y_n) \times ln(1-x_n))−n1∑(yn×lnxn+(1−yn)×ln(1−xn)) ,其中y是target,x是模型输出的值。
所以对于第一行:
- 第一列 0×ln0.3992+(1−0)×ln(1−0.3992)=−0.50950\times ln0.3992 + (1-0) \times ln(1-0.3992) = -0.50950×ln0.3992+(1−0)×ln(1−0.3992)=−0.5095
- 第二列 1×ln0.2232+(1−1)×ln(1−0.2232)=−1.49971 \times ln0.2232 + (1-1) \times ln(1-0.2232) = -1.49971×ln0.2232+(1−1)×ln(1−0.2232)=−1.4997
- 第三列 1×ln0.6435+(1−1)×ln(1−0.6435)=−0.44081\times ln0.6435 + (1-1) \times ln(1-0.6435) = -0.44081×ln0.6435+(1−1)×ln(1−0.6435)=−0.4408
第二行:
- 第一列 0×ln0.3800+(1−0)×ln(1−0.3800)=−0.47800\times ln0.3800 + (1-0) \times ln(1-0.3800) = -0.47800×ln0.3800+(1−0)×ln(1−0.3800)=−0.4780
- 第二列 0×ln0.3044+(1−0)×ln(1−0.3044)=−0.36300 \times ln0.3044 + (1-0) \times ln(1-0.3044) = -0.36300×ln0.3044+(1−0)×ln(1−0.3044)=−0.3630
- 第三列 1×ln0.3241+(1−1)×ln(1−0.3241)=−1.12671\times ln0.3241 + (1-1) \times ln(1-0.3241) = -1.12671×ln0.3241+(1−1)×ln(1−0.3241)=−1.1267
第三行:
- 第一列 1×ln0.6281+(1−1)×ln(1−0.6281)=−0.46511\times ln0.6281 + (1-1) \times ln(1-0.6281) = -0.46511×ln0.6281+(1−1)×ln(1−0.6281)=−0.4651
- 第二列 0×ln0.4689+(1−0)×ln(1−0.4689)=−0.63280 \times ln0.4689 + (1-0) \times ln(1-0.4689) = -0.63280×ln0.4689+(1−0)×ln(1−0.4689)=−0.6328
- 第三列 1×ln0.3834+(1−1)×ln(1−0.3834)=−0.95871\times ln0.3834 + (1-1) \times ln(1-0.3834) = -0.95871×ln0.3834+(1−1)×ln(1−0.3834)=−0.9587
去掉负号求个均值:
0.5095+1.4997+0.40083=0.81670.4780+0.3630+1.12673=0.65590.4651+0.6328+0.95873=0.6855
\frac{0.5095+ 1.4997+0.4008}{3} = 0.8167 \\
\frac{0.4780+0.3630+1.1267}{3} = 0.6559 \\
\frac{0.4651+ 0.6328 + 0.9587}{3} = 0.6855
30.5095+1.4997+0.4008=0.816730.4780+0.3630+1.1267=0.655930.4651+0.6328+0.9587=0.6855
再取个平均:
0.8167+0.6559+0.68553=0.7194
\frac{0.8167+0.6559+0.6855}{3} = 0.7194
30.8167+0.6559+0.6855=0.7194
下面我们用BCELoss来验证一下Loss是不是0.7194:

BCEWithLogitsLoss
BCEWithLogitsLoss就是把Sigmoid和BCELoss合成一步。我们直接用刚刚的input验证一下是不是0.7193:


2万+

被折叠的 条评论
为什么被折叠?



