腾讯一面 面试题 那时候研一上学期刚结束 还不太扎实 勉勉强强算了一遍,这里重新整理下
首先写出多分类交叉熵损失函数公式:
那么
y
j
y_j
yj是真实标签向量one-hot表示,
a
j
a_j
aj是模型输出标签向量表示。
假设
y
j
y_j
yj = [1, 0 ,0]
a
j
a_j
aj = [0.7, 0.1, 0.1]
那么相当于
计算其损失为:
L = -1 * ln0.7 - 0 * ln0.1 - 0 * ln0.1 = -1ln0.7
腾讯一面 面试题 那时候研一上学期刚结束 还不太扎实 勉勉强强算了一遍,这里重新整理下
