基于年龄感知的表观年龄估计系统
一、引言
近年来,年龄估计在全球范围内得到了广泛研究。利用面部图像进行年龄估计时,与使用非面部图像的方法相比,受试者的抵触情绪和心理负担更小,因为面部相较于其他身体特征更易暴露于社会。所以,基于面部图像和外貌信息的年龄估计方法正被积极研究。面部、发型、服装和外貌等视觉信息能体现年龄和性别的特征,其中面部信息被认为包含最多的年龄特征,因为人们在交流时通常通过观察面部来估计对方年龄,因此许多基于面部图像的年龄估计方法被提出。
不过,现有的年龄估计技术存在一些问题。它们大多只能对人进行粗略分类,识别准确性的可靠性存疑。例如,19岁和20岁可能被分到不同类别,而20岁和29岁却被归为同一类别,这显然不合理。此外,提取大量特征时难以准确提取。为解决这些问题,本文提出了一种利用面部整体特征进行逐岁年龄估计的方法,同时对特征数据进行基于双眼的归一化处理,并关注人类感知机制,旨在获取年龄和表观年龄的特征,实现像人类一样自动对每个年龄进行分类。
具体做法是,先给定基于人主观判断的面部图像表观年龄,再通过计算机模拟进行估计。估计方法采用有监督自组织映射(SOM),划定15 - 64岁的范围,创建一维年龄估计图,实现连续估计。利用遗传算法(GA)提取对年龄估计重要的特征数据,并提出一种原创的面部图像归一化技术,减少不必要信息,实现仅基于面部信息的年龄估计,最后通过基于真实数据的计算机模拟验证方法的有效性。
二、预处理
为了比较面部图像,需要进行面部归一化和表观年龄数据库的创建。
1.
面部图像数据库
:面部数据库由日本的Human and Object Interaction Processing(HOIP)组织提供,受试者为不同年龄段且不戴眼镜的人。所有受试者的背景和拍摄条件相同,要求受试者以自然的表情面对相机镜头拍摄。本文使用了预先经过预处理的252人作为研究对象,且已获得SOFTOPIA JAPAN公司的使用许可,未经授权不得复制、使用和分发。
|参数|详情|
| ---- | ---- |
|尺寸|640×480 [pix.]|
|颜色|24位彩色|
|每个性别图像数量|150张|
|年龄分布|每5岁30张图像|
|表情|中性|
-
归一化
:面部图像归一化对年龄估计至关重要。本文基于双眼对面部图像进行归一化,原因如下:
- 与面部其他特征相比,眼睛在旋转和尺寸归一化方面更容易操作。
- 已有许多关于提取眼睛区域的研究。
归一化步骤如下:
- 将原始图像(640×480像素,24位彩色)转换为8位灰度图像,并进行中值滤波以去除噪声。
- 提取双眼的中心位置。
- 旋转连接双眼的线段,使其与水平线匹配。
- 通过缩放将双眼之间的距离调整为80像素。
- 以双眼连线的中点为标准点,在水平方向上向左右各扩展90像素,垂直方向上向上扩展45像素、向下扩展180像素,裁剪出图像,得到中心部分的180×225像素的图像。
- 制作低分辨率图像(12×15像素)。
graph TD;
A[原始图像] --> B[转换为灰度图像并滤波];
B --> C[提取双眼中心位置];
C --> D[旋转连线与水平线匹配];
D --> E[调整双眼距离为80像素];
E --> F[裁剪图像];
F --> G[制作低分辨率图像];
- 表观年龄数据库 :本文通过对38名受试者进行问卷调查来确定表观年龄。让更多受试者参与问卷调查可以提高表观年龄评估的客观性,选择不同年龄段和性别的受试者可以减少每个年龄的估计误差。具体问卷方法是,受试者观察归一化后的面部图像,凭直觉依次估计年龄。当某个受试者给出的年龄与其他多数受试者给出的表观年龄明显偏差时,将其作为异常值排除,表观年龄取排除异常值后受试者给出年龄的平均值,并将该年龄作为教师数据。
- 特征数据提取 :本文认为面部形状和皱纹信息对年龄特征很重要,因此使用快速傅里叶变换(FFT)提取年龄特征,采用频谱数据作为特征数据。但所有频谱中包含了对年龄估计不必要的数据,因此使用遗传算法(GA)选择用于年龄估计的特征数据。
三、年龄估计系统与特征数据选择
FFT后的频谱特征数据很多,但并非所有数据都对年龄估计重要,因此需要进行特征选择。本文使用GA进行特征选择,并结合有监督SOM开发了一个使用少量特征数据的年龄估计系统。
1.
特征数据提取
:年龄特征体现在皮肤纹理中,通过傅里叶变换提取特征数据。遗传算法(GA)模仿生物进化过程,是一种广泛使用的优化技术。本文将有监督SOM年龄估计系统的识别误差边际用于GA的适应度函数,选择使识别误差边际尽可能小的频带区域组合。适应度函数如下:
[Fitness = 1 - \frac{error}{error_{max}}]
其中,
error
是有监督SOM的年龄误差边际,
error_max
是最大年龄误差边际,经验确定为20。
GA的参数设置如下:
|参数|详情|
| ---- | ---- |
|个体数量|20|
|代数|1000|
|交叉方法|均匀交叉|
|交叉率|0.8|
|变异率|0.02|
|染色体|由GA确定|
-
特征数据选择 :频率特征不仅包含年龄特征,因此需要进行特征数据选择,使用遗传算法(GA)完成。有监督自组织映射(SOM)是一种两层神经网络,由输入层和竞争层组成,并通过教师数据进行训练。本文设计了一维有监督SOM进行年龄估计,可连续识别年龄。用于年龄估计的特征数据通过遗传算法获得,并由有监督SOM进行训练。本文将教师数据和输出结果的误差边际平均值作为年龄估计误差边际。有监督SOM的参数如下:
|参数|详情|
| ---- | ---- |
|学习次数|10000|
|类别数量|50|
|输入数量|由GA确定| -
年龄估计 :为了实现连续年龄估计,使用有监督SOM这一具有两层结构的神经网络。
四、计算机模拟
为验证本文方法的有效性,进行了计算机模拟。仅对50名男性进行年龄估计,并研究了低分辨率图像。识别准确性通过交叉验证方法计算。
| 特征使用情况 | 年龄误差边际 |
|---|---|
| 使用所有特征 | 9.96岁 |
| 使用选择的特征 | 6.8岁 |
| 人类年龄感知 | 4.94岁 |
结果表明,使用少量数据进行年龄估计具有较高的识别准确性,且年龄误差边际接近人类水平。此外,通过GA选择的特征数据数量大幅减少,约减少了83%,所选数据包含低频和高频部分。对提取的数据进行逆FFT得到的图像显示,使用模糊图像也有可能进行年龄估计,这说明人类的面部氛围和形状在年龄感知中很重要,低分辨率图像也可用于年龄估计。
通过对有监督SOM学习后的权重进行研究发现,随着年龄增长,某些节点的权重值呈现出一定规律,这表明人类特征随年龄增长而连续变化,实际频谱数据也验证了这一假设。不过,仍有一些受试者的年龄估计误差较大,可能是因为归一化图像中包含了如衣服、头发等对年龄估计不必要的信息。
综上所述,本文提出的基于GA和有监督SOM的年龄估计系统能有效减少不必要数据,提高识别准确性,接近人类的年龄感知能力。未来的工作将分析现有误识别的原因,提高年龄估计系统的识别准确性,寻找最佳图像尺寸,提出统计估计方法,增加受试者数量并纳入女性受试者进行研究。
基于年龄感知的表观年龄估计系统
五、结论
本文提出了一种基于遗传算法(GA)和有监督自组织映射(SOM)的新型年龄估计系统,通过有监督SOM实现连续的年龄估计,并利用GA基于人类感知进行特征选择。为验证该方法的有效性,进行了计算机模拟,结果显示:
-
数据优化效果显著
:GA大幅减少了不必要的数据,使识别准确性接近人类水平。从特征数据数量来看,使用所有特征时年龄误差边际为9.96岁,而使用GA选择的特征后,年龄误差边际降至6.8岁,所选特征数据数量也从原本的较多数量减少了约83%。
-
低分辨率图像可用
:低分辨率图像的识别准确性高于归一化图像,这表明人类面部的整体氛围和形状在年龄感知中起着重要作用,即使是模糊的低分辨率图像也有可能用于年龄估计。
虽然计算机难以完全获得与人类相同的感知,但本研究在一定程度上实现了接近人类感知的年龄估计,朝着让计算机具备人类感知能力的研究方向迈进了一步。
六、未来展望
为了进一步提升年龄估计系统的性能,未来将开展以下几方面的工作:
1.
分析误识别原因
:深入分析当前存在的误识别情况,找出导致误差的具体原因,从而针对性地改进年龄估计系统,提高识别准确性。
2.
寻找最佳图像尺寸
:由于在低分辨率图像中提取到了高频特征,接下来将探索最优的图像尺寸,以平衡图像信息和计算成本,进一步提高年龄估计的效果。
3.
提出统计估计方法
:基于人类特征随年龄连续变化的假设,开发统计估计方法,更准确地对年龄进行估计。
4.
扩大研究范围
:增加受试者的数量,并纳入女性受试者,使研究样本更加全面,提高年龄估计系统的通用性和可靠性。
七、总结与回顾
下面通过表格和流程图对整个年龄估计系统的关键步骤和要点进行总结回顾。
年龄估计系统关键信息总结
|步骤|详情|
| ---- | ---- |
|预处理| - 面部图像数据库:由HOIP组织提供,含不同年龄段不戴眼镜人群,经预处理的252人数据,获使用许可
- 归一化:基于双眼,经灰度转换、滤波、提取双眼位置、旋转、缩放、裁剪等步骤,制作低分辨率图像
- 表观年龄数据库:通过对38名受试者问卷调查确定,排除异常值后取平均值作为表观年龄
- 特征数据提取:用FFT提取特征,GA选择用于年龄估计的特征数据|
|年龄估计系统与特征数据选择| - 特征数据提取:傅里叶变换提取特征,GA根据适应度函数选择频带区域组合
- 特征数据选择:GA用于选择包含年龄特征的频率数据,有监督SOM进行训练和年龄识别
- 年龄估计:使用有监督SOM实现连续年龄估计|
|计算机模拟| - 对50名男性进行估计,用交叉验证法计算识别准确性
- 结果显示使用少量特征数据识别准确性高,误差接近人类水平|
graph LR;
A[预处理] --> B[面部图像数据库];
A --> C[归一化];
A --> D[表观年龄数据库];
A --> E[特征数据提取];
B --> F[年龄估计系统与特征数据选择];
C --> F;
D --> F;
E --> F;
F --> G[特征数据提取];
F --> H[特征数据选择];
F --> I[年龄估计];
G --> J[计算机模拟];
H --> J;
I --> J;
J --> K[得出结果与结论];
通过以上总结可以清晰地看到,整个年龄估计系统是一个环环相扣的过程,每个步骤都对最终的年龄估计结果产生影响。未来的研究将围绕当前系统存在的问题和不足展开,不断完善和优化年龄估计系统,使其更加准确和可靠。相信随着研究的深入,年龄估计技术将在更多领域得到广泛应用。
超级会员免费看
1629

被折叠的 条评论
为什么被折叠?



