a novel facial emotion recognition scheme based on graph mining翻译

摘要

近年来,科学、社会、技术领域已经见证了图数据应用的激增。在这些领域当中,表情识别是令人感兴趣的一个领域,其在实际生活中产生了许多应用,如:人机交互、驾驶安全、疼痛监测等等。在这篇论文中提出了一种新的基于图挖掘的人脸表情识别方法,跳脱了人脸区域表征的定式,改用由节点和边组成的图来表征人脸区域,并且采用gSpan频繁子图挖掘算法来发现表情图数据中的频繁子结构。通过采用重叠率公式来减少子图的数量。在所有选中的子图被编码完成后,用二分类的分类器对输入图片进行表情分类,其中表情类别为六类。在SAVEE数据集上应用该方法,将准确率在当前90%的基础上提高了2%。

1.介绍

在模式识别和人工智能领域表情识别是非常热门的话题,表情识别在这些领域有各种各样的应用,如:智能系统和人机交互。一般来说,表情识别分为两步:特征提取、分类。特征提取定义了一组能够描述人脸表情的独立属性。分类是将特征分为表情类别中的一种,如开心、悲伤、厌恶、愤怒、惊讶等。特征选择技巧和分类器的设计是人脸表情系统在非常重要的步骤,其决定了一个人脸表情识别系统鲁棒性的好坏。一个新的表情分类算法有时并不能起到好的作用,就是因为没有提取到有用的特征。

各种独特的提取特征的方法经常被提出,如基于几何和基于外观的方法。面部关键点和面部决定性部位等几何特征对于理解人脸表情所传达的情感非常重要。最近,基于面部关键点提取有区分度的特征提出了许多新方法。

另一方面,在模式识别和机器学习领域,图表征或得了非常大的关注。图的主要优点是它能很好地表征有结构的数据。许多工作用到了EBGM算法用于人脸识别,但是在这些工作中,都是使用的整张图,作者并没有试图使用与表情相关的面部子图,这些子图与面部表情的改变息息相关。因此,以前的工作大多是产生大量的特征,但是这些特征往往是不相关的。本文以图挖掘为出发点,提出了一种新的人脸表情检测方法,利用图挖掘技术来减小最终提取的特征的尺寸,提高准确性。本文其余部分如下:第二章介绍了图挖掘概念和cat swarm intelligence的理论背景。第三章介绍了本文提出的方法。第四章介绍了实验结果。最后一章对工作进行了总结以及展望未来。

2.理论背景

2.1图挖掘概念

在表征具有复杂结构的数据的时候,图变得越来越重要,如:图片,化学分子,生物网络,web, xml文本。这些领域可以利用到许多图的属性。因此,图挖掘算法被用于分析不同的图属性。

一张图可以定性理解为点和边构成的集合, 图的顶点表示离散的信息,而图的边表示这些信息之间的关系。假设一个数据集D有N张不同的图,G1=(N1, A1)...Gn=(Nn, An),则第i张图的点集为Ni, 第i张图的边集是Ai。Ni中的每个点p和标签l(p)有关。

2.1.1匹配和距离计算

图匹配是用以评估不同图之间相似性的方法。为了检验两张图是否匹配,图中的节点必须建立一一对应的关系,如:标签匹配,或对应节点之间存在边也匹配。换言之,如果两张图不匹配,则他们的距离为0. 因此,两张图之间的距离计算问题就转化为图片匹配问题。匹配图片换句话说就是同构。

2.1.2频繁子图挖掘

在进行不同图集的表征, 分类, 聚类时,频繁子图是非常有用的方法。频繁子图挖掘(FSM)是一个发现子图的过程,子图往往在同一数据集中产生。在这个背景下,通常指所讨论的图形出现的次数超过了任意阈值(最小支持)的次数。 由于FSM不依赖训练数据,频繁子图挖掘被认为是一种无监督学习。gSpan是FSM算法中的一种。gSpan通过限制产生需要检验的候选子图,来避免产生多余的子图。此算法是最早的深度优先FSM算法之一,可以通过以下概念来理解:

1)gSpan编码。gSpan编码是边的有序集合,其顺序由深度优先遍历过程中边是如何遍历的来确定。gSpan编码中的每条边是一个五元组,由端点的唯一索引(第一和第二个元素),标签(第三河第五个元素),边标签(第四个元素)所组成。

2)最右边扩展。边在gSpan编码中通过最右边扩展的方式进行扩展,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值