人脸关键点检测10——FAN

本文介绍FAN网络,一种基于Heatmap回归的人脸关键点检测方法,利用HourGlass架构和残差模块,构建强大基准,同时提出大规模3D人脸特征点数据集LS3D-W,深入分析网络规模对人脸对齐的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

人脸关键点检测10——FAN

 

版权声明: https://blog.youkuaiyun.com/u013841196/article/details/81048357

《How far are we from solving the 2D & 3D Face Alignment problem? (and a dataset of 230,000 3D facial landmarks)》

  • ICCV2017,诺丁汉大学,FAN

1.引言: 
cascaded regression methods 在人脸对齐上取得不错的效果,但是当存在 large (and unfamiliar) facial poses(也就是一部分特征点 self-occluded landmarks or large in-plane rotations)cascaded regression methods 效果就不太好。近年来 fully Convolutional Neural Network architectures based on heatmap regression have revolutionized human pose estimation,于是沿着这个思路来做人脸对齐。 
本文主要有以下5个贡献: 
1) 结合最先进的人脸特征点定位(landmark localization)架构和最先进的残差模块(residual block),首次构建了一个非常强大的基准,在一个超大2D人脸特征点数据集(facial landmark dataset)上训练,并在所有其他人脸特征点数据集上进行评估; 
2) 我们构建一个将2D特征点标注转换为3D标注,并所有现存数据集进行统一,构建迄今最大、最具有挑战性的3D人脸特征点数据集LS3D-W(约230000张图像); 
3) 基于 LS3D-W,我们训练了一个 3D 人脸对齐网络,并在这个数据库上评估了 3D 人脸对齐 ; 
4)我们深入分析了影响人脸对齐的各个因素,并引入了一个新的因素:网络规模 the size of the network ; 
5) 我们发现不管是2D 人脸对齐网络还是3D 人脸对齐网络 在目前的数据库上性能都不错,可能接近目前数据库性能上的饱和。

2.相关工作: 
2D face alignment: 这里主要使用的是 cascaded regression 方法,基本解决可控人脸姿态的数据库 LFPW , Helen and 300-W 
CNNs for face alignment:cascade CNN;multi-task learning;recurrent neural networks ; 
Transferring landmark annotations 数据集的迁移学习

3.Datasets 
当前 2D 3D 人脸对齐数据库的一些情况 
这里写图片描述 
度量方法: 
一般使用的度量方法是 the metric used for face alignment is the point-to-point Euclidean distance normalized by the interocular distance (对大角度侧脸数据不友好); 
这里我们改进了一下度量方式:normalize by the bounding box size. In particular, we used the Normalized Mean Error(用框来归一化)。 
这里写图片描述 
4.网络结构: 
2D-FAN、3D-FAN结构:通过堆叠四个HG构建的人脸对齐网络(Face Alignment Network ,FAN),其中所有的 bottleneck blocks(图中矩形块)被替换为新的分层、并行和多尺度block。 
这里写图片描述 
基于人体姿态估计最先进的架构之一HourGlass(HG)来构建FAN,并且将HG原有的模块bottleneck block替换为一种新的、分层并行多尺度结构(由A. Bulat and G. Tzimiropoulos提出的)。 
注:《Binarized convolutional landmark localizers for human pose estimation and face alignment with limited resources》 
文章首先构建人脸对齐网络“FAN”(Face Alignment Network),然后基于FAN,构建2D-to-3D-FAN,也即将给定图像2D面部标注转换为3D的网络。文章表示,据测试所知,在大规模2D/3D人脸对齐实验中训练且评估FAN这样强大的网络,还尚属首次。 
 
2D-to-3D-FAN网络架构:基于人体姿态估计架构HourGlass,输入是RGB图像和2D面部坐标,输出是对应的3D面部坐标。 
Label: 对一个2D的关键点,包含一个2D Gaussian with std=1px centerd 在每个关键点位置。

5.性能评估: 
 
注:二维高斯分布函数: 

参考: 
1.https://blog.youkuaiyun.com/zhangjunhit/article/details/78500362 
2.https://www.cnblogs.com/molakejin/p/8027573.html

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值