标签平滑论文笔记:2020《When Does Label Smoothing Help?》
这里写目录标题标签平滑:这里记倒数第二层的激活函数后输出值(在最后权重和softmax概率分布之前的值)为 x 。(倒数第二层偏置是1)pk是样本属于第k个类的概率值,wk表示最后一层对应第k类的权重。把wk看成第k类的模板(template),xTwk的值可以看成欧式距离的一种度量(负号):xTx在计算softmax输出时被分离出来,wkTwk是每个类的常数。此样本对应的标签的第k个类的概率值是yk(one-hot硬标签)。这个网络的损失函数(交叉熵):标签平滑:平滑参数:α鼓励网
原创
2020-10-03 21:16:21 ·
2202 阅读 ·
0 评论