一、交叉熵损失
交叉熵损失(Cross-Entropy Loss)主要用于分类任务。它衡量了预测的类别分布与真实类别分布之间的差异。交叉熵损失越小,说明模型的预测分布越接近真实分布。
1、公式
(1)对于单个样本
交叉熵损失的公式为:
:类别的总数。
: 真实标签的分布,是 one-hot 编码的(即只有一个类别为 1,其余为 0)。
: 模型预测的概率分布(通常通过 softmax 归一化后的输出)。
(2)对于一个批量的样本
交叉熵损失的平均值是:
: 批量中的样本数量。
: 第
个样本真实的 one-hot 标签。
: 第
个样本预测的概率分布。
2、工作原理
(1)预测概率
模型通过 softmax 层输出每个类别的概率分布,满足:
(2)真实分布
真实类别使用 one-hot 编码,比如:
如果真实类别是第 2 类(索引为 1,假设从 0 开始),则。
(3)计算损失
交叉熵损失将真实标签与预测概率进行比较:
仅使用真实类别 的项计算损失。
对于上述 one-hot 编码和预测概率 ,交叉熵损失为:
3、使用场景
(1)二分类任务
二分类使用的是 二元交叉熵损失(Binary Cross-Entropy Loss)。公式:
(2)多分类任务
使用标准交叉熵损失,并结合 softmax。
(3)多标签任务
每个标签独立计算二元交叉熵损失,并求和。
二、结构相似性指数损失(SSIM)
SSIM 是一种用于衡量两张图像结构相似性的指标。它主要评估图像的亮度、对比度和结构信息之间的差异,是一种常用于图像质量评估的标准。
1、公式
(1)SSIM主要组成部分
-
亮度(Luminance):衡量两张图像在亮度上的差异。
-
对比度(Contrast):衡量两张图像在对比度上的差异。
-
结构(Structure):衡量两张图像在结构上的相似性。
(2)计算公式
给定两张图像 和
,它们的局部结构相似性可以通过以下三个成分来计算:
和
:分别是图像
和
的均值(亮度);
和
:分别是图像
和
的方差(对比度);
:是图像
和
的协方差(结构);
和
是为了避免分母为零的小常数,通常设定为:
,
;
其中, 和
是常数,
是图像的动态范围(例如,8位图像的 L=255)。
2、计算步骤
(1)计算均值(亮度)
对于每个像素块,计算图像 和
的局部均值:
其中 是像素块中的像素数量。
(2)计算方差(对比度)
对于每个像素块,计算图像 和
的局部方差:
(3)计算协方差(结构)
对于每个像素块,计算图像 和
的局部协方差: