基于心理密码书写的单次试验认证
萨拉·N·阿卜杜勒卡德尔(✉),艾曼·阿提亚,和穆斯塔法‐萨米·M·穆斯塔法
人机交互实验室,计算机科学系,赫勒万大学计算机与信息学院,埃及 开罗
nabil.sarah@gmail.com, ayman@hci.fci.helwan.edu.eg, mostafa.sami@fci.helwan.edu.eg
摘要
本文提出了一种使用脑电波作为生物特征辨别特征的认证系统。该系统利用用户在心理书写其自有密码时产生的脑电图(EEG)信号。采用独立成分分析(ICA)和基线校正进行预处理和去噪。研究了两种特征类型在此活动中的影响:多变量自回归(MVAR)模型参数和功率谱密度(PSD)特征。基于单次试验分析的性能结果表明,想象密码书写在使用PSD特征时可达到平均半总错误率(HTER)为5%,而使用 MVAR系数时为3%。实验表明,心理密码书写可用于提高注册条件下的用户接受度,同时保持较高的性能表现。
关键词 :脑电图 · 脑机接口验证 · 生物特征认证 · 心理书写
1 引言
表征这个时代的科技革命给人类生活的各个方面带来了诸多便利与舒适。它实现了快速的信息交换,如高效的邮件投递系统、远程通信和跨国交易。然而,这些优势也伴随着数据保密性日益脆弱的风险,从而引发了对先进身份认证机制的迫切需求。这些机制负责确认或拒绝用户的声称的身份。如[1]所述,身份认证机制主要采用三种基本技术:基于知识的认证、基于物品的认证以及基于生物特征的认证。
基于知识的身份验证需要用户拥有某些专属信息,包括密码和个人识别号码。此类技术可能遭受多种攻击,例如肩窥和用户疏忽。通过基于对象的身份验证可以克服与密码相关的一些弱点。在此技术中,用户持有用于后续身份确认的物理对象,如卡片或令牌。它们不能像交换密码那样随意共享。然而,此类方法仍然可能因卡片被盗而被破解。
基于生物特征的身份认证,涉及对生理特征或个人特质的测量,可应对前述类型所关联的窃取漏洞
生物特征可分为两大类:生理特征和行为特征。
生理生物识别依赖于人体的物理特征,而行为生物识别或行为识别则依赖于基于动作的特征,如步态识别、手势识别、击键动力学和语音识别。
一种相对较新的区分性特征——电生理学,已被用于行为生物特征认证。它反映了生物系统在持续活动下的电特性和电压变化。多种电生理学信号读数在生物特征识别方面展现出巨大潜力。这些信号根据生物电信号的来源具有特定名称,例如源自心脏的信号称为心电图(ECG),源自大脑皮层的信号称为皮层脑电图(ECoG),以及如[2]中所述的源自大脑的信号称为脑电图(EEG)。
本文提出了一种新的心理认证活动,并研究了其在满足各种生物特征评估因素方面的表现。下一节重点介绍了以往研究中用于个人识别和认证的不同活动,以及所采用的评估标准。
2 相关工作
脑电图(EEG)用于研究大脑电压的差异,这些差异反映了在各种脑机接口(BCI)应用中运动或心理活动的发生。某些行为引起的大脑反应已被用于验证声称的身份,甚至适用于各类残障人士,或如Su等人在[3]中所暗示的,通过识别过程传递秘密信息。他们设计了一种身份识别系统,能够检测以咬紧牙齿肌肉活动形式表达的隐蔽警告。该系统采用功率谱密度作为特征,并结合线性判别分析(LDA)和K近邻(KNN)分类器,在存在警告的情况下获得了90%的识别准确率,而无警告情况下的识别系统准确率为93.7%。
2.1 个人身份识别与认证
一些研究人员已探讨了脑信号在不同激励动作下的个人识别和验证系统中的应用。视觉诱发电位和图形刺激已被广泛应用于多种形式,例如通过呈现自面孔或非自面孔图像进行面部刺激,正如Yeom及其同事在[4, 5]中所预期的那样。
他们首先选择与每个用户相关的高度区分性通道和时间成分。然后利用多次试验平均后的ERP信号来计算相应特征。他们达到的均值准确率为86.1%。而 Ravi[6]和Zúquete[7]向70名个体展示了来自Snodgrass和Vanderwart图片集的黑白图片。Ravi使用40赫兹脑电振荡实现了95.25%的识别准确率。而苏克特等人则关注减少电极的使用量。比较了两种分类器K‐NN和支持向量数据描述(SVDD)的性能,其在八个电极上的最佳结果分别为95.1%和98.5%。
阿什比等人在[8]中利用基于心理的动作,如基线测量、肢体运动、计数和旋转,对五名受试者进行身份认证。他们使用Emotiv公司生产的低成本脑电图耳机采集14通道信号,从而提高了系统的基于价格的可采集性。他们在区分五种类型特征时,采用一对多SVM分类器达到了98.78%的平均准确率。另一方面,赫马及其同事[9]特别关注阅读和乘法心理反应的唯一性。他们从脑电β波中提取功率谱密度(PSD)特征,并将其应用于前馈神经分类器。该系统在识别六名受试者时达到了97.5%的平均准确率。在[10]中,使用前馈神经网络对不同受试者的心理拼写和阅读活动的PSD特征进行了分类。该识别系统基于单次试验分析的准确率达到78.6%,而多次试验平均则达到90.4%。
Marcel等人在[11]中将词语的心理生成应用于身份认证。所有受试者使用相同的随机选择的首字母。他们提出了一种基于高斯混合模型和单词生成以及运动想象脑电图信号的最大后验模型自适应的统计框架。在单日内,对于混合模型中不同数量的高斯成分,运动想象的HTER范围为6.6%到20.5%,而单词生成的HTER范围为12.1%到26.1%。
为了结合基于知识与生物特征的身份认证,斯沃戈尔和基萨松迪[12]探讨了将用户的心理状态与其密码相结合的想法。密码被划分为称为pels(密码元素)的较小单元。用户确定与每个元素相关联的心理状态。
2.2 生物特征评估因素
基于生物特征的身份认证系统根据验证因素进行评估,如[13]中所示。它们可以分为如图1所示的一般因素、系统相关因素和用户相关因素。一般因素包括认证特征的基本特性,如普遍性、唯一性和永久性。普遍性验证该特征是否存在于每个人类个体中,而唯一性确保每个人特征的独有性。永久性或恒定性验证所测量的生物现象在时间上的不变性。系统相关因素确保可采集性、定量方面以及估计的系统性能。最后,用户相关因素涉及可用性和用户接受度。
在[7],苏克特等人批评了视觉刺激在脑机接口认证中针对一般性及系统相关因素的应用。他们认为,对于盲人或有严重视觉损伤的人群,普遍性要求并未完全满足,但没有证据表明唯一性遭到破坏。根据他们的研究结果,由于认知活动周围环境的可变性,恒定性在一定程度上受到质疑。脑电记录也应谨慎管理,以满足可收集性条件并提高信噪比,尤其是考虑到脑电图信号的低功率特性。电极必须始终放置在相同的头皮位置,但这一问题通常通过使用脑电头盔得以解决。
根据Chuang等人的研究[14], 可用性问题与两个主要原因有关,一是脑电图硬件,二是心理任务。在记录硬件方面,相比必须仔细放置在头皮上的自由排列电极,集成于无线耳机中的侵入性较小的干式接触电极更受青睐。他们通过让认证实验的参与者填写问卷来评估心理任务的可用性。所评估的任务包括闭眼呼吸、想象手指运动、运动想象、唱歌、听音调并配合眼部反应、计数特定颜色物体以及密码思维。
问卷关注了三个因素:难度、枯燥感和重复意愿。据称,在所执行的任务中,运动想象和密码思维是最具难度的任务。受试者在想象肌肉动作时难以避免身体反应。此外,持续一致地唤起伴随所选密码思维的特定情感或事件被证明很难。受试者表示,他们认为手指运动是最无聊的任务。呼吸和计数颜色是推荐程度较高的可重复任务。尽管呼吸任务表现出良好的可用性结果,但它不适合用于发送秘密信息,而密码思维、个性化运动、歌曲以及与颜色相关的任务则适合。另一方面,与其余四种心理活动相比,计数颜色任务存在回忆秘密属性的困难,因为受试者在回忆其选择的个性化运动、歌曲和密码思维方面并无困难。
在下一节中,提出了一种基于单次试验基础上的想象密码书写认证系统。该系统结合了传统密码的记忆回忆与特定的心理书写动作。这类心理活动有助于发送隐蔽信息。通过使用易于佩戴的脑电记录耳机,该系统提高了可用性因素。同时,它不需要先前的
用于训练以应对该系统。此外,该系统仅需3到4分钟即可完成样本采集过程。所使用的数据集是在正常环境条件下从六名受试者收集的。
3 系统描述
参与者的脑电图信号,如图2所示,经过不同阶段的处理以完成验证过程。这些阶段包括预处理、特征提取和分类。以下小节详细介绍了每个阶段所涉及的算法。
3.1 预处理
每位受试者采集到的信号均经过独立成分分析(ICA)处理。ICA是一种用于盲源分离的统计方法[15, 16],通过对提供的多维信号进行空间滤波,以减少伪迹、提高信噪比(SNR)并促进脑电图(EEG)源定位[17]。在本系统中,输出信号的维度与输入信号相同。此外,如[18]所述,该阶段也采用了基线校正。
3.2 特征提取
已研究了两种类型的心理密码特征,即时间分析特征和频谱分析特征。多变量自回归(MVAR)系数表示时域特征。它们可用于建模脑电多通道时间序列,其中单个通道信号的每个值的预测不仅依赖于该时间序列的先前值,还依赖于其他通道信号的先前值[19]。实验中采用了六阶MVAR,并使用Vieira‐Morf方法进行估计[20]。本实验也涉及频谱特征。功率谱密度(PSD)通过伯格方法计算,采用六阶自回归模型[21]。
3.3 分类
支持向量机(SVM)已被用于受试者验证过程中的最终决策。它利用判别超平面来识别不同类别。所选择的超平面是使不同类别的最近训练点之间距离最大化的那个超平面。该最优超平面由位于边界上的向量描述,这些向量被称为支持向量,如[22]中所述。如果当前受试者提供的特征与声称的身份特征属于同一类别,则对该受试者进行认证。
4 实验与结果
4.1 数据集
为了研究前述系统的性能,我们进行了一项涉及六名受试者的实验。使用 EMOTIV设备通过十四个通道记录脑电图信号。这些通道按照国际10–20系统分布,分别为AF3、F7、F3、FC5、T7、P7、O1、O2、P8、T8、FC6、F4、F8、AF4。在训练阶段,通过听觉提示刺激受试者,指示用户回忆自己的密码,结合基于知识和生物特征的认证。密码由四位数字组成,在所有受试者中统一设置,以追踪密码窃取的影响。实验包括五次运行,每次运行包含一个由20次试验组成的会话。
4.2 性能评估
性能评估与提升旨在减少两种错误类型:误接受率(FAR)和误拒率(FRR)。误接受率(FAR)衡量被错误认证的受试者所占的百分比,而误拒率(FRR)表示拒绝正确的身份所占的百分比。为了同时考虑这两种错误,采用了半总错误率(HTER),即FAR和FRR的平均值[24]。
4.3 结果
结果是通过使用10折交叉验证,对每位受试者重复五次运行,并采用一对所有方案获得的。结果表明,使用MVAR模型进行特征提取的错误率为44%,低于仅在预处理阶段使用ICA空间滤波时PSD特征所得到的45.08%。在对脑电图信号进行基线功率校正后,MVAR建模参数和PSD特征的错误率分别降低至3%和5%。每种特征提取方法的详细结果见表1和2。每位受试者的平均结果如图3所示。已进行方差分析检验以追踪基线功率校正对认证过程的影响。MVAR模型和PSD特征的P值均小于0.05,该P值表明基线功率校正对两种特征类型的分类结果具有显著影响。
表1. 基线校正后多变量自回归系数(MVAR)的认证性能
| R_1 | R_2 | R_3 | R_4 | R_5 | Mean | |
|---|---|---|---|---|---|---|
| S_1 | 0.1 | 0 | 0.025 | 0.025 | 0.025 | 0.035 |
| S_2 | 0 | 0 | 0 | 0.075 | 0.025 | 0.02 |
| S_3 | 0.05 | 0.1 | 0.1 | 0.075 | 0.1 | 0.085 |
| S_4 | 0 | 0 | 0.025 | 0 | 0.025 | 0.01 |
| S_5 | 0.025 | 0 | 0 | 0.025 | 0 | 0.01 |
| S_6 | 0.025 | 0.025 | 0.025 | 0 | 0.025 | 0.02 |
| Mean | 0.033 | 0.020 | 0.029 | 0.033 | 0.033 | 0.03 |
表2. 基线校正后功率谱密度(PSD)的认证性能
| R_1 | R_2 | R_3 | R_4 | R_5 | Mean | |
|---|---|---|---|---|---|---|
| S_1 | 0.15 | 0.025 | 0.05 | 0.025 | 0 | 0.05 |
| S_2 | 0.025 | 0 | 0 | 0.05 | 0.025 | 0.02 |
| S_3 | 0.025 | 0.075 | 0.075 | 0.025 | 0.075 | 0.055 |
| S_4 | 0.075 | 0.075 | 0.1 | 0.1 | 0.05 | 0.08 |
| S_5 | 0.05 | 0 | 0 | 0.05 | 0.025 | 0.025 |
| S_6 | 0.025 | 0.05 | 0.05 | 0.125 | 0.125 | 0.075 |
| Mean | 0.058 | 0.037 | 0.045 | 0.062 | 0.05 | 0.050 |
结果表明,心理密码书写活动在相同密码的认证过程中具有高效性。所提出的系统在性能上优于Marcel等人[11]针对以相同字母开头的不同单词所实现的心理单词生成。他们的系统在运动想象任务中达到的HTER值为6.6%,在单词生成任务中为12.1%。未来工作将进一步研究使用不同密码的影响。
5 结论
本文提出了一种基于脑电图的认证系统,该系统利用心理密码书写活动。其目标是在获得合理性能结果的同时,考虑用户对注册条件的接受度。系统采用独立成分分析(ICA)和基线校正进行预处理,功率谱密度(PSD)和多变量自回归系数(MVAR)进行特征提取,支持向量机(SVM)进行分类。最终发现表明,基线校正在提升性能结果方面起到了显著作用。同时,时间序列建模特征和功率谱密度特征在此类活动中表现出相当的性能。

被折叠的 条评论
为什么被折叠?



