深度学习在人脸识别中的应用:损失函数与模型架构解析
1. 深度学习人脸识别基础
在深度学习人脸识别中,深度神经网络(DNN)涉及的参数数量通常极为庞大。为避免过拟合问题,大规模的训练集是必不可少的。以图中所示的深度模型为例,其最后三层为全连接层。前两个全连接层与ReLU操作相关,而最后一层使用softmax损失函数进行分类,最后一层的神经元数量等于要区分的类别数量。
softmax损失函数能促使不同类别的深度特征可分离,但对于人脸识别而言,这还不够,我们还需要特征具有更强的判别性,以增强特征的泛化能力。常见的深度架构如AlexNet、GoogleNet、ResNet等,常被用作人脸识别的基线模型,此外也有其他专为人脸识别设计的新颖深度架构。
2. 损失函数详解
损失函数用于评估网络对训练样本分类的准确性,其中softmax损失函数较为常用。该损失函数认为输出层的得分或神经元输出是各类别的未归一化对数概率。若$z_i$和$p’_i$分别表示第$i$个输出神经元的得分和未归一化对数概率,则有$z_i = \log p’_i$或$p’_i = e^{z_i}$。
归一化概率$p_i = \frac{\exp (z_i)}{\sum_{j=1}^{N} \exp (z_j)}$,其中$N$是类别数量。softmax损失$L_{SM}$定义为:
[L_{SM} = -\sum_{t=1}^{M} \log \left(\frac{\exp (z_i)}{\sum_{j=1}^{N} \exp (z_j)}\right)]
其中$M$是训练样本数量,$z_i = W_i^T x_t + b_i$。这里$x_t \in R^d$表
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



