交叉熵损失函数（Cross-Entropy Loss）

一头代码

于 2025-01-28 20:14:04 发布

阅读量598

点赞数 3

文章标签：深度学习神经网络

本文链接：https://blog.youkuaiyun.com/gggfJJ/article/details/145388701

版权

交叉熵损失函数（Cross-Entropy Loss） 是深度学习中常用的损失函数之一，尤其在分类任务中广泛应用。它的作用是衡量模型预测的概率分布与真实标签分布之间的差异，从而指导模型优化。以下是对交叉熵损失函数的详细解释：

对于分类问题，假设：

交叉熵损失函数的公式为：

CrossEntropy(y,y^)=−∑iyilog⁡(y^i)CrossEntropy(y,y^)=−i∑yilog(y^i)

其中：

假设批次大小为 3，labels = [0, 1, 2]，表示：

余弦相似度矩阵经过 Softmax 后可能如下：

复制

[[0.7, 0.2, 0.1],  # 第 0 个 query 与 3 个 title 的相似度
 [0.1, 0.6, 0.3],  # 第 1 个 query 与 3 个 title 的相似度
 [0.2, 0.3, 0.5]]  # 第 2 个 query 与 3 个 title 的相似度

交叉熵损失函数会计算：

CrossEntropy=−(log⁡(0.7)+log⁡(0.6)+log⁡(0.5))CrossEntropy=−(log(0.7)+log(0.6)+log(0.5))

模型的目标是最小化这个损失值，即提高正样本对的概率，降低负样本对的概率。

交叉熵损失函数的作用是：