【论文学习】人脸识别——FaceNet:超级经典的paper(triplet loss)

FaceNet是一篇2015年的经典人脸识别论文,它提出了一种端到端的人脸识别解决方案,包括使用深度CNN学习128维人脸特征向量,并通过引入Triplet loss优化特征分布。Triplet loss旨在增大类间距离,减小类内距离,文章还探讨了Triplet样本的选择策略以及网络结构如Zeiler&Fergus和Inception模型,实现在LFW数据集上达到99.63%的精度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

又是超级经典的一篇人脸识别paper,提供了一种端到端的处理,提出了新颖的loss function,好文值得多读!

FaceNet这篇paper是2015年的论文,实验效果非常好,在LFW中达到了99.63%的精度。

实现了利用端到端的网络学习在欧式距离空间的128维人脸特征向量。并提出了triplet loss,通过loss函数直接学习embedding feature,并且优化feature的分布。

基本框架

先看FaceNet的基本框架,如下图所示。

Pipeline:先通过一个比较大batch_size输入人脸图像数据x,通过深度CNN之后就会得到一个feature map,再对其做L2归一化之后就可以得到对这张人脸的表示embedding,然后用triplet loss(anchor, positive, negative)方法对这整个模型进行端到端的训练。

文章是直接通过网络生成feature,并且希望feature是距离线性空间,距离近则为人脸的ID接近。

Triplet loss

paper中提出的triplet loss十分值得学习,先看什么是triplet loss:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值