Face Recognition using Gabor Filters

本文提出了一种基于Gabor滤波器和神经网络的面部识别算法,通过RMS对比度缩放和图像变形提高性能。使用15个Gabor滤波器处理图像,然后在多层感知器上训练,对光照和姿态变化具有鲁棒性。实验在PIE数据库上进行,验证了方法的有效性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

摘要

  基于Gabor的人脸表示在人脸识别中取得了巨大的成功。本文提出了一种利用Gabor特征训练的神经网络进行人脸识别的新算法。在不同尺度上对一系列图像进行有效的卷积。本文的两个新贡献是:RMS对比度的缩放和变形作为图像识别完善的一个进步。基于多层感知器(MLP)结构和反向推进算法,结合Gabor-jet的卷积滤波响应,实现了人脸识别。在不同光照条件下采集的变形人脸图像数据库上,验证了该算法的有效性。

1 引言

  Gabor特征在计算机视觉、图像处理、模式识别等领域得到了广泛的关注。使用Gabor过滤器的主要动机是生物相关性,即哺乳动物初级视觉皮层神经元的感受野轮廓是定向的,并具有特征的空间频率。Gabor滤波器可以利用显著的视觉特性,如空间定位、方向选择性和空间频率特性[1]-[2]。考虑到这些压倒性的能力和它在人脸识别中的巨大成功,本文利用Gabor特征来表示人脸图像,并与神经网络协同产生识别任务。
  文献中已经发表了大量基于Gabor的图像识别的研究工作。Lades等人开发了一个基于Gabor小波的人脸识别系统,该系统使用动态链路架构(DLA)框架,通过在人脸图像[3]上的矩形网格的每个节点提取Gabor jets来识别人脸。Wiskott等人随后对DLA进行了扩展,开发了一种基于Gabor小波的弹性束图匹配(EBGM)方法,用于[4]面部图像的标记和识别。在EBGM算法中,人脸被表示为一个图,图中的每个节点都包含一组系数,称为jets。然而,DLA和EBGM都需要大量的计算成本。Liu和Wechsler开发了一种基于Gabor特征的分类协议,使用Fisher线性判别模型进行[5]降维。Shan等人利用AdaBoost策略开发了一种用于[6]人脸识别的增强fisher模型。Zhang等人提出了一种利用Gabor相位模式[7]的直方图进行人脸识别的方法。
  本文提出了一种基于Gabor滤波系数的神经网络人脸识别方法。由于均方根对比对图像表示是合理的,尝试集中在均方根缩放上。rms对比度的缩放可以提高识别性能。尽管具有鲁棒性,但是基于Gabor滤波器的特征选择方法通常由于高维Gabor特征而计算昂贵。为了降低特征维数,本文采用15 个Gabor滤波器;3个尺度,5个方向。
  本文的其余部分组织如下。第二节描述图像预处理。第三节描述了Gabor滤波器的设计。第四节介绍了用反向传播算法构建神经网络的方法。第五部分给出了实验方法和结果,最后在第六部分对实验结果进行了讨论,得出了结论并提出了未来的工作方向。

2 图像预处理

  首先将原始图像转换为灰度图像。在每张人脸图像上对准两只眼睛的中心,对所有图像进行适当的旋转、平移、缩放和裁剪,得到100×100个像素。然后对图像进行一些预处理操作。图像预处理阶段包括对比度和光照均衡、直方图均衡和变形。

A.对比度和光照均衡:

  对比度是衡量人类视觉系统灵敏度的一个指标。虽然对比度在计算机显示器的视觉处理中起着重要的作用,但在过去几乎所有的文献中都研究了不同光照条件下、不同光照和对比度下的人脸识别过程。为了达到有效的和心理上有意义的表示,所有的图像处理相同的光照和均方根对比度。对应亮度标准差的均方根对比度量用[8]表示:
在这里插入图片描述
  其中 x i x_i xi是归一化后的灰度值,满足 0 < x i < 1 0<x_i<1 0<xi<1,x是平均的归一化后的灰度值。根据这个定义,如果他们的均方根对比度是相等的,不同人脸的图像具有相同的对比度。均方根对比度不依赖于图像的空间频率对比度或图像中对比度的空间分布。所有的图像都保持在相同的光照和相同的条件下RMS对比用下式:
在这里插入图片描述
  其中为对比度,为从原始图像f到新图像g需要增加或减少的亮度。和的值是根据经验选取的。照明和均方根对比度均衡过程如图1所示。
在这里插入图片描述
图1.照明和RMS对比度均衡。捕获图像的照明角度-38.4º,-21.6º,-0.2º,20.6º,分别37º。

B.直方图均衡

  由于光照条件的限制,人脸图像的对比度可能很差。因此使用直方图均衡化来补偿光照条件和改善图像[9]的对比度。

C.变形图像:

  变形是一种特殊的效果,在电影和动画,改变(或变种)一个图像到另一个无缝过渡。它通常被用来描述一个人通过一些魔法或技术手段变成另一个人,或者作为一个幻想或超现实序列的一部分。我们使用基于像素的变形[10]技术来提高人脸图像识别的完善性。变形在源图像和目标图像之间提供了一些中间阶段,如果两幅图像是同一个人,我们可以将其视为中间姿势。
  当一张脸在运动时;从左到右,从右到左,或者其他的,在那个时刻捕捉到的图像可能会有运动模糊。为了识别不同姿势的图像,一个特定的脸在-20º,-10º, 0º,10°,20º五个不同的旋转图像和生成12中间时刻变化的四个顺序对每一对3图片。所以我们对于一个特定的面部图像得到了17个不同的旋转面部图像。

3 Gabor滤波器设计

  Gabor滤波器作为局部空间频率分布的带通滤波器,在空间和频域都实现了最佳的分辨率。二维Gabor滤波器 Ψ f , θ ( x , y ) Ψ_{f,θ}(x,y) Ψf,θ(x,y)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值