基于深度学习的端到端人脸识别技术:全面调研

本文全面介绍了端到端深度学习人脸识别技术的发展,包括人脸检测、预处理及表征等关键技术环节。覆盖了最新算法设计、评估指标、数据集及性能比较等内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

44页,共计371篇参考文献。本文全面介绍了端到端深度学习人脸识别技术,包括人脸检测,人脸预处理和人脸表征等方向,详细介绍了最新的算法设计,评估指标,数据集,性能比较等。

The Elements of End-to-end Deep Face Recognition: A Survey of Recent Advances

论文: The Elements of End-to-end Deep Face Recognition: A Survey of Recent Advances
作者单位:上海大学, 京东AI研究院

注:如果上述论文链接无法访问,可以看文末,论文已上传至百度云,方便下载。

人脸识别是计算机视觉社区中最基本和长期存在的主题之一。随着深度卷积神经网络和大规模数据集的最新发展,深度人脸识别取得了显著进展,并已广泛应用于现实应用中。给定自然图像或视频帧作为输入,端到端深度人脸识别系统将输出脸部特征以进行识别。

2013年-2020年7月 深度学习人脸识别论文数量

为此,整个系统通常由三个关键要素构成:人脸检测,人脸预处理和人脸表征。

人脸检测可定位图像或帧中的人脸。然后,进行人脸预处理以将人脸校准为标准视图,并将其裁剪为归一化的像素大小。最后,在人脸表征阶段,从经过预处理的人脸中提取判别特征进行识别。这三个要素都由深度卷积神经网络实现。

在本文中,由于蓬勃发展的深度学习技术极大地提高了它们的能力,因此我们对端到端深度人脸识别的每个元素的最新进展进行了全面的调查。

首先,我们介绍了端到端深度人脸识别的概述,如上所述,它包括人脸检测,人脸预处理和人脸表示。

然后,我们分别回顾了基于深度学习的每个元素的进展,涵盖了许多方面,例如最新的算法设计,评估指标,数据集,性能比较,存在的挑战以及有希望的未来研究方向。

人脸检测

具有代表性的人脸检测算法路线图:

速度接近实时的人脸检测器

人脸检测数据集:

人脸预处理

具有代表性的人脸预处理方法路线图:

人脸预处理方法分类:

人脸关键点数据集

人脸表示/表征

人脸表示方法的分类:

在LFW、MegaFace上的性能比较

我们希望这项调研能够为我们带来有益的想法,以便更好地了解端到端人脸识别的概况并以系统的方式进行更深入的探索。

论文下载

链接: https://pan.baidu.com/s/1ceCdUWc5Au5tCyTjV0iyzg
提取码:cver

强烈推荐大家关注CVer知乎账号和CVer微信公众号,可以快速了解到最新优质的CV论文。

推荐阅读

TBC:共享Thinner Filters,实现更强的CNN!

综述 | 行人检测技术(从手工特征到深度学习):全面调研

超越EfficientNets!无需注意力,也能让你的网络更快更强!

OpenCV 4.5来了!更强的SIFT,改进RANSAC算法,新增目标跟踪网络SiamRPN++

综述 | 基于深度学习的实时语义分割方法:全面调研

涨点神器!南航提出AFF:注意力特征融合

NeurIPS 2020 | 谷歌大脑提出:重新思考预训练和自训练

NeurIPS 2020 | 用于图像复原/恢复的神经稀疏表示

NeurIPS 2020 | aLRPLoss:统一目标检测中的分类和定位的平衡损失函数

ECCV 2020 | MIRNet:学习丰富的特征以进行真实图像修复和增强

CCE:具有互补交叉熵的不平衡图像分类

谷歌地标检索2020 Kaggle 第一名解决方案

ECCV AIM 2020 真实图像超分辨率挑战赛3项冠军解决方案

LVIS 实例分割挑战赛2020的第一名解决方案:好的Box不能保证好的Mask

ETH Zurich提出DPIR:具有Denoiser先验的即插即用图像恢复

IR R-CNN:小目标检测的内在关系推理

综述 | 人脸图像质量评估:全面调研(2004-2020)

MAFFSRN:具有多注意力层的超轻量级图像超分辨率

冠军解决方案 | RMGL:用于行人重识别的感受野多粒度表示

VarifocalNet:IoU-aware 密集目标检测器(已开源)

ECCV 2020 | NAS-DIP:通过NAS实现DIP(去噪/去雾/超分辨率/修复等)

TIP 2020 | PNEN:金字塔Non-Local增强型网络

综述 | 小样本学习:全面调研(Few-shot)

MiCo:用于半监督域自适应的Mixup联合训练

使用深度神经网络从Noisy Labels中学习:全面调研

PyTorch3D:面向3D计算机视觉的PyTorch工具箱

剪枝filter?还是剪枝layer?这是个问题

牛津大学VGG组提出:自监督实例自适应的单目深度估计

ECCV 2020 | WeightNet:重新探索Weight网络的设计空间

Mask TextSpotter v3:用于场景文字检测和识别的分割Proposal网络

ECCV 2020 | URIE:用于视觉识别的通用图像增强

ECCV 2020 | 魔鬼在细节中:车辆重识别的自监督注意力(SAVER)

ECCV 2020 | 53.5 AP!PAA:用于目标检测的IoU预测的概率Anchor分配

ECCV 2020 | 南京理工提出FPT:特征金字塔Transformer

ECCV 2020 | 长尾数据集中多标签分类的分布平衡损失

清华大学提出ISDA:使用语义数据增广来正则化深度网络

ECCV 2020 | BMask R-CNN:边界保持的Mask R-CNN

ECCV 2020 | 即插即用!PSConv:将特征金字塔压缩到紧凑的多尺度卷积层中

ECCV 2020 | STTN:用于视频修复的时空联合Transformer

ECCV 2020 | LiteFlowNet3:实现更准确的光流估计

 

发布于 14 小时前

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值