脑电图控制辅助设备研究

原创于 2025-10-17 16:28:24 发布 · 938 阅读

29 ·

CC 4.0 BY-SA版权

文章标签：

#脑机接口 # 脑电图 # 运动想象 # P300 # 旋转森林

11 脑电图控制的辅助设备

阿卜杜勒哈米特·苏巴西工程学院，埃法特大学，吉达，沙特阿拉伯

引言

大脑产生的脑电图（EEG）信号被用于脑机接口（BCI），以将这些脑电图信号解释为对外部设备进行控制的指令，例如计算机、平板电脑、手机、轮椅和假肢。脑机接口框架提供了大脑与世界之间的一种新连接方式，绕过了人体本身。因此，该框架可用于改善残疾人生活质量（高、关、高和周，2015）。

脑机接口系统通常被用于支持具有不同异常状况的人群，例如处于闭锁状态的患者。由于闭锁患者依赖他人照顾，脑机接口可以为他们提供更高质量的生活和更大的自主性。最近，研究人员对脑机接口技术在中风及其他慢性疾病患者神经康复中的不同应用产生了兴趣（麦克法兰德和沃尔帕，2017）。

非侵入式脑机接口系统利用脑电图信号将受试者的思维或意图解释为设备控制信号，使残疾人能够与计算机、轮椅或神经假肢进行交互。通过运动想象（MI）可以实现手或脚运动的心理练习，而无需实际执行（扎雷、何、西乌利和张，2017）。P300事件相关电位（ERP）（达席尔瓦‐绍尔、瓦莱罗‐阿瓜约、德拉托雷‐卢克、龙‐安格文和瓦罗纳‐莫亚，2016；Gao等人，2015；拉富恩特、戈里兹、拉米雷斯和冈萨雷斯，2017；李和金，2018；塞尔勒斯、克鲁先斯基、麦克法兰德、沃恩和沃尔帕，2006；沙赫里亚里和埃弗拉尼， 2013）、慢皮层电位、α和β频段振荡（古格等人，2001；普弗茨歇勒等人， 2006）以及稳态视觉诱发电位（SSVEP）（张、关和王，2008）已被应用于脑机接口系统中。常见的脑机接口技术是基于P300的ERP，该电位在接收到偶然或显著刺激后约300毫秒出现（沃尔帕、比尔鲍默、麦克法兰德、普弗茨歇勒和沃恩，2002；达席尔瓦‐索尔等人，2016）。大多数情况下，MI方法用于基于振荡的脑机接口系统，以在 α和 β频段的脑电图中产生事件相关同步（ERS）和事件相关去同步（ERD）。这类脑机接口系统被用于轮椅导航或计算机屏幕上光标的控制。因此，已实施了许多基于MI的脑机接口方法，如脚部运动、左右手运动、舌头运动和/或心算。携带

本文档由funstory.ai的开源PDF翻译库BabelDOCv0.5.10(http://yadt.io)翻译，本仓库正在积极的建设当中，欢迎star和关注。

在基于稳态视觉诱发电位的脑机接口系统中，使用与刺激源频率相同的脑电图振荡。稳态视觉诱发电位方案采用不同的刺激频率来控制机器人或手机。另一方面，利用脑电图中P300成分的基于P300的脑机接口系统通常用于提高拼写设备的通信速度（古尔等人，2009）。经过训练阶段后，可通过受试者思维控制计算机操作。因此，脑机接口系统主要利用脑电图信号来控制轮椅、机械臂或计算机光标（Sanei，2013年）。法威尔和多尼钦（1986）首次实现了一种脑机接口系统，该系统采用奇球范式，允许受试者通过依次选择字母在计算机上拼写单词。在此模型中，所有字母和其他有用符号均显示在计算机屏幕上，以便受试者拼写字符时短暂地在视觉上集中注意力于相关单元格；与此同时，代表该聚焦单元格的行或列闪烁，会在脑电图中产生P300成分（沙赫里亚里和埃弗拉尼，2013）。

脑电信号处理在脑机接口中的主要目标是构建一个框架，以实现人类与外部设备（如机械臂、轮椅或拼写器）之间的非物理接触式交互。此类框架可以帮助残疾人，使他们能够进行日常活动。此类脑机接口框架的框图如图11.1所示。根据该图，在信号采集之后，采用多尺度主成分分析（PCA）（MSPCA）来消除不同类型的脑电噪声和伪迹。在第二步中，通过不同的时频域方法提取相关特征以训练分类器。然后使用降维技术来减少

示意图0

262 生物电子学与医疗设备

不必要的特征，从而实现更好的分类准确率。在完成分类任务后，会生成相应的命令来控制设备（加埃米、拉什迪、普尔拉希米、卡曼达尔和拉达里， 2017）。

文献综述

神经系统损伤或疾病最令人困扰的结果是运动功能的丧失。过去几十年中，脑电控制辅助设备已实现利用脑电活动来控制人工假肢、轮椅和计算机。然而，这些人工设备的性能相较于自然肢体运动的准确率和速度仍较低。在实际的基于运动想象的脑机接口框架中，用户想象移动不同的身体部位，例如右手或腿部运动，而计算机学习如何区分同步采集的脑电活动的不同模式。脑机接口的主要目标是利用脑信号生成必要的指令以控制外部设备。最重要的应用是绕过身体的失能部分或激活瘫痪器官。脑机接口系统被用作脊髓损伤、肌萎缩侧索硬化症（ALS）、脑瘫和中风等不同神经肌肉疾病患者的一种特殊沟通方式（萨内，2013）。

运动想象是将受试者的运动意图解释为控制信号。根据运动想象节律，可采用多种应用，例如玩电脑游戏或控制鼠标（拉马丹和瓦西拉科斯，2017）。运动想象在治疗由中风、脊髓损伤和帕金森病引起的神经运动障碍方面具有重要作用（瓦西里耶夫、利布尔基娜、亚科夫列夫、佩雷佩尔基娜和卡普兰， 2017）。由于大多数中风患者会出现肢体完全瘫痪，这种生理信号模态提供了一些优势，可通过其监测与运动控制相关的脑活动。基于运动想象范式的脑机接口被用于向患者提供他们在进行运动想象任务时的参与反馈（利米等人， 2014）。

凯基乔格鲁和阿伊德米尔（2010）使用从脑电图信号的二阶多项式系数中提取的二维特征向量，然后采用k近邻（k‐NN）算法进行分类。在脑机接口竞赛2003年数据集Ia上，分类的准确率和速度均实现了显著提升。利米等人（ 2014年）从中风受试者的机器学习视角比较了与运动相关的脑电特征的稳定性和可靠性。李、张、汗和米（2018）提出了一种新框架，该框架结合了频带选择共空间模式算法和通过粒子群优化的最小二乘孪生支持向量机（SVM），用于运动想象模式识别。巴阿里、霍尔希德塔拉布、梅斯巴和萨拉米（2015）在基于脑电图的脑机接口运动想象模式识别中提出了线性预测奇异值分解方法。

克夫里奇和苏巴西（2017年）比较了三种

263 脑电图控制的辅助设备

常用的信号处理方法，如离散小波变换（WT）(DWT)、经验模态分解（ EMD）和小波包分解（WPD），用于脑机接口中的脑电图信号分解。采用了 BCI竞赛III数据集IVa，即一个2类运动想象数据集。他们使用k近邻分类器结合WPD实现了92.8%的分类准确率。饶和谢勒（2010）使用了两种不同的脑机接口系统来控制一个人形机器人在虚拟世界中导航。扎雷等人（2017）结合主成分分析（PCA）和互协方差技术，用于脑机接口实现中基于脑电图的心理状态判别信息提取。他们提出的特征集实现了高性能。

一种监督滤波方法被用于进化多目标特征选择，以对高维数据进行分类，由Mart´ın‐Smith、Ortega、Asensio‐Cubero、Gan和Ortiz（2017年）提出。特征从脑电图信号中通过不同域的多分辨率分析提取，然后使用线性判别分析（LDA）进行脑机接口分类任务。苗、王和刘（2018）提出了线性判别准则，以选择具有高判别能力的通道。此外，采用人工蜂群算法在无需先验知识的情况下，同时确定时间间隔和频带的全局最优组合，而无需依赖共空间模式特征提取和分类。

法威尔和多尼钦（1986）采用了一种基于P300的脑机接口，其中在注意的目标刺激出现后约300毫秒脑电图中的正电位作为控制信号。P300信号通过目标刺激中等稀有出现时对脑电图响应进行平均，并结合大量非目标刺激而诱发。受试者面对一个6×6的包含字母和其他符号的矩阵，当矩阵的行和列以随机顺序反复闪烁时，受试者关注想要选择的目标项。目标项闪烁时的平均反应时间与其他项的平均反应时间不同。因此，脑机接口检测该差异并确定受试者想要选择的项目。受试者可以使用该脑机接口拼写单词（麦克法兰德和沃尔帕， 2017）。因此，P300脑机接口拼写系统使人们能够通过视觉刺激在计算机上拼写文本。已有多种分类算法，如线性判别分析、人工神经网络和支持向量机，被用于有效检测P300信号（李和金，2018）。

尼博尔等人（2008）研究了基于P300的脑机接口解释设备对肌萎缩侧索硬化症患者的有效性。在每组闪烁之后，对信号应用逐步线性判别函数进行分类。他们进行了两项实验：一项实验使用六名参与者和636矩阵，另一项实验使用四名参与者和636或737矩阵来生成新颖且自发的语句。古格等人（ 2009）实现了P300拼写器，采用两种不同模型：（1）单字符（SC）拼写器，每个字符单独闪烁；（2）行/列（RC）拼写器，同时表示多个字符。当目标字符出现时，SC闪烁器预计会产生更可靠的控制和更高的P300幅度。沙赫里亚里和埃弗拉尼安（2013）开发了一种基于P300的框架，使个体能够与6 36矩阵上显示的36个符号中的一个进行交互。当受试者意识到目标符号时，会产生由P300表征的独特事件相关电位。此外，为了提高脑电图中P300的检测效果，在脑机接口框架中采用了基于子空间的空间滤波器。

264 生物电子学与医疗设备

池上、高野、近藤、佐伯和神作（2014）采用了双步拼写器和传统RC拼写器来评估P300脑机接口系统的性能。对照组受试者的性能显著高于肌萎缩侧索硬化症患者，但肌萎缩侧索硬化症患者的准确率在新视觉刺激下显著提高。因此，与传统RC拼写器相比，所提出的方法为肌萎缩侧索硬化症患者实现了更好的准确率。阿克兰、韩和金（2014）集成词典和两个模型接口，在单词输入期间向用户提供建议，以使用户输入更轻松并加快输入过程。包含词典的目的是向用户提供单词建议，使用户无需拼写完整单词，而只需拼写每个单词的少数几个字符即可输入单词。此外，在另一项研究中，阿克兰、韩和金（ 2015）还提出了一种新型P300分类器，通过结合首字符输入和单词建议来提高分类性能和单词输入速度。T9界面被修改为类似手机键盘的形式，用于短信发送。采用多棵决策树的随机森林（RF）分类器显著提高了P300分类准确率。

达席尔瓦‐绍尔等人（2016年）试图研究用户注意力如何影响拼写任务的性能，使用了三种不同的基于P300的脑机接口方案：第一种采用736符号矩阵，第二种结合单词预测器，第三种是基于P300的拼写器，显示类似于T9手机界面的简化43 3符号矩阵。

盖伊等人（2018年）使用视觉P300拼写脑机接口系统，检查患有ALS的残疾人是否能在日常生活环境使用脑机接口。该框架由连接到独立键盘‐显示控制软件的脑电图采集组成。瑞安、汤城、盖茨、科尔韦尔和塞尔勒斯（2017年）结合了颜色模型和棋盘模型。他们指出，彩色棋盘矩阵比传统的灰白相间棋盘模型实现了更快的通信速度、更高的个人偏好和更高的准确率。此外，颜色刺激改善了顶叶/枕叶电极处的事件相关电位，并实现了更好的分类准确率。王、顾、于和李（2017年）采用了一种自训练正则化 WOS‐ELM分类器，以较低的计算复杂度训练出鲁棒的P300分类器。经过短暂训练后，P300拼写系统转换为输入模式，可在输入几个字符后提高拼写准确率。李和金（2018年）提出了一种集成支持向量机来改进P300拼写器，其中不同的分类器通过多样化数据集进行训练，以增加集成的多样性。因此，通过增加多样性提高了集成算法的分类性能。刘等人（2018年）使用一种称为 BN3的深度卷积神经网络，自动检测P300信号的判别性时空特征。他们表明， BN3在字符识别性能上优于现有的检测算法。

脑电图

脑电图用于测量反映人类大脑电活动的电位。汉斯·伯格于1929年引入了第一台脑电图记录仪。他

265 脑电图控制的辅助设备

提出，脑信号会随着大脑功能状态的变化而变化。在脑电图测试期间，多个电极被放置在头皮的不同位置。每个电极通过放大器连接到脑电图记录仪。最后，脑电图信号被转换为计算机屏幕上的波形，以分析记录（西乌利，李和张， 2016）。

脑电图在脑机接口应用中很受欢迎，并广泛应用于认知心理学、认知科学、神经科学和心理生理学研究。由于脑电图信号涉及大量数据，因此应开发脑电图信号的计算机辅助分析，以更好地理解脑机接口应用中的心理状态。脑电图的一个新应用领域是脑机接口，这是一种实现计算机与大脑之间交互的技术。

基于计算机的脑机接口系统获取脑信号并将其解释为指令。为了采集脑电图信号，需在头皮上佩戴电极帽。受试者想象特定任务，例如肢体运动或构词，以控制机器。计算机分析并识别不同任务的脑电图信号模式，从而移动光标或控制轮椅（Siuly等，2016）。

脑机接口

脑机接口系统为患有严重残疾的个体提供辅助设备，使他们能够执行身体动作。实际上，这种疾病并不影响视觉、听觉以及理解周围发生事件等认知功能，但会影响肌肉的控制。当运动通路丧失时，任何与环境进行正常交互的方式也随之失去。在这种情况下，脑机接口提供了一种交流的选择。因此，脑机接口是一种大脑与机器/计算机之间的直接交互，计算机直接接收来自大脑的指令，而无需任何身体参与（格莱曼，艾利森和普富尔茨勒，2009）。图11.2表示脑电图控制的辅助设备。

基于选择性注意的脑机接口需要外周刺激，这些刺激可以是多种多样的、可感知的刺激、不同的音调或不同频率闪烁的光。在一个典型的脑机接口系统中，每种刺激用于控制脑机接口系统。受试者应关注相应的刺激以选择命令。实际上，视觉注意可以通过P300电位或稳态视觉诱发电位实现。基于P300的脑机接口系统采用闪烁序列作为刺激，这些刺激通常是字母或符号，用于控制机械臂、移动机器人或光标。对特定闪烁字母或符号的选择性注意会产生一种称为P300的脑电模式，该模式在接收刺激后约300毫秒出现。脑机接口系统通过检测该P300信号来确定用户希望选择的字母或符号（格赖曼等人，2009）。

肢体运动或单个肌肉收缩会改变大脑活动，而运动想象也会改变所谓的感觉运动节律。振荡活动的减少称为事件相关去同步化，振荡活动的增加称为事件相关同步化。运动想象是指在不进行实际动作的情况下想象运动

示意图1

266 生物电子学与医疗设备

ERD/ERS模式。因此，脑机接口可以通过想象右手、左手、脚以及舌头运动来进行控制。与基于选择性注意的脑机接口不同，运动想象脑机接口是一种需要学习的能力，并且不依赖于外部刺激（格赖曼等人，2009）。因此，利用分类方法准确识别与实际任务相关的不同运动想象类别至关重要，因为基于运动想象的脑机接口系统通过运动想象状态将受试者的运动意图转化为控制信号（Siuly等，2016）。

信号去噪方法

脑电图信号包含多种伪迹，例如眨眼、心电图（ECG）以及其他内部或外部干扰噪声，这些伪迹应当被清除。可以使用不同的技术来去除这些伪迹。脑电图设备中现有的硬件滤波器能够滤除大部分伪迹和噪声(Sanei，2013年)。

脑信号通过脑机接口（BCI）进行采集和处理，以区分不同的用户意图模式。脑电信号分析与处理分为三个主要步骤：预处理/去噪、特征提取/降维以及检测/分类。预处理的主要目标是在不丢失相关信息的前提下简化后续流程，并通过提高信噪比（SNR）来增强信号质量。较低的信噪比意味着脑电信号模式被抑制在其余信号中，相关模式难以被检测。但较高的信噪比会使脑机接口的检测和分类任务更简单。滤波器和变换方法，如独立成分分析（ICA）、主成分分析（PCA）、核主成分分析（KPCA）和多尺度主成分分析（ MSPCA），常在脑机接口的预处理阶段使用。研究人员采用这些方法通过信号变换来消除或至少减少不需要的信号成分。这些方法可能改善信噪比

（格赖曼等人，2009）。通过盲源分离可以消除眨眼和心电图伪迹，其中伪迹独立成分被自动移除，剩下的即为无伪迹头皮脑电图。

主成分分析

PCA是一种降维和特征变换技术，其中n维数据被表示在低维空间中，以降低时间复杂度、自由度和维度。此外，在另一域中表示的数据在平方和误差方面表现出最佳变化。包含多个源的信号使用PCA进行分割，如果事先已知独立成分的数量，则效果更佳（曹、徐、庄、李和顾，2007；杜达、哈特和斯托克，2012）。

独立成分分析

ICA从一组任意变量或信号中提取出隐含在源或因子中的部分，以将它们转换到另一个域。该方法应用于大量已确定的多变量数据，以描述观测值的创造性模型。所变换的因子无论是线性还是非线性都被认为是未知的。主要假设是这些源相互独立。ICA通过利用估计数据中源的独立性来分离这些源，是一种比传统技术（如PCA）更强大的技术（詹姆斯和赫斯，2004）。事实上，在应用常见的去相关技术后，任何独立成分的线性组合都可以转换为不相关的成分，其中混合是正交的。因此，ICA的关键点在于评估去相关后允许的正交变换。因此，可以通过更强类型的去相关来尝试执行ICA，即定义一种符号化表示，使其在应用多种非线性变换后仍保持不相关（Hyv¨arinen，2013）。ICA也可用于从纯肌电信号中分离伪迹成分。

多尺度主成分分析

主成分分析的能力可以与小波分析的能力相结合，形成多尺度主成分分析，从而利用小波变换提取特征的能力消除变量之间的关系，并去除自相关测量之间的关联。多尺度主成分分析通过在每个尺度上计算小波系数的主成分分析，并整合相关尺度上的结果。由于多尺度主成分分析包含了在时间和频率上行为不同的事件的贡献，因此具有高效性（巴克希，1998）。

如果将输入和输出变量表示在小波域中，并采用适当的方法选择小波系数，则各种方法都可以得到改进。多尺度主成分分析通过在选定的小波上对每个变量进行分解，从而结合了小波分析和主成分分析的特点。

268 生物电子学与医疗设备

通过计算系数矩阵的主成分分析（巴克希、班萨尔和努诺，1997）。主成分分析解除了变量之间的相关性，而小波分解实际上解除了随机测量值之间的相关性。通过根据应用的特性采用阈值标准，在每一尺度上选择小波系数和一部分主成分。当多尺度主成分分析的目标是去除多变量噪声时，任何单变量阈值技术都可能设置每一尺度上潜在变量的阈值（巴克希，1999）。

MSPCA（巴克希，1998）方法可分为三个主要步骤实现。首先，使用小波对来自Xn3m的所有信号进行小波分解。然后，针对每个小波分解层数，分别应用主成分分析去噪算法，并保留具有特定阈值的小波系数。最后，将所有层次的主成分分析处理结果合并，得到去噪后的输入信号矩阵_Xn3 m（巴克希，1998）。图 11.3展示了MSPCA的步骤，其去噪性能优于主成分分析算法（凯夫里奇和苏巴西， 2017）。

示意图2

269 脑电图控制的辅助设备

由于持续时间有限且频率受限，需要对脑电图信号进行有效分解，以整合时间、频率和空间维度。可以使用时频（TF）方法对脑电图信号进行分解，这些方法能够检测时间和频率上的变化。此外，神经活动可以通过时频域特征来描述，用于脑机接口应用（凯夫里奇和苏巴西，2017；Sanei，2013年）。

为了获得更好的性能，必须处理定义信号适当特征的较少数量的值。通常通过将信号转换为称为特征提取的相关特征向量来将特征累积成特征向量。信号分类框架分析信号的独特特征，并根据这些独特特征确定信号的类别（ Siuly等，2016）。时频方法（TF方法），如维格纳‐维尔变换、短时傅里叶变换、小波变换、离散小波变换、小波包变换、可调Q因子小波变换、双树复小波变换（DTCWT）、经验模态分解和集合经验模态分解，可在时域和频域对信号进行分解。在本研究中，基于小波变换的方法，即小波包分解（ WPD）和DTCWT，被应用于脑电图信号以进行特征提取。

小波包分解

小波变换（WT）通过将信号分解为一组基函数来实现更好的时间分辨率。通过伸缩和平移，利用单个函数获得小波（Vetterli和Herley，1992）。信号x（t）的连续小波变换（CWT）表示如下（Daubechies,1990；Rioul和Vetterli，1991）：

$$
CWTx \tau; a \left( \right) = \int_{-\infty}^{\infty} x(at) \frac{1}{\sqrt{|a|}} \psi \left( \frac{t - \tau}{a} \right) dt
$$

ψ(t)表示基本小波或母小波，而a被视为用于平移函数x(t)的尺度因子，变量 τ用于调整时间尺度。 ψ(t)被称为带通函数，通常以某些中心频率f 0为中心，通过尺度a(Daubechies，1990；Rioul和Vetterli，1991；Thakor, Gramatikov,Sherman和Bronzino,2000)允许对 ψ(t)进行压缩或扩展。

WPD被称为DWT的扩展，通过该方法对低频成分（即近似分量）进行分解。然而，WPD同时利用了近似分量（低频成分）和细节分量（高频成分； Daubechies，1990；Learned和Willsky，1995；Unser和Aldroubi， 1996）。DWT和WPD彼此不同，因为WPD将低频和高频成分都分离到各自的子层次中。因此，WPD实现了对分解信号更高的频率分辨率。WPD被视为一种连续时间小波变换，它在每个尺度或层级上的不同频率处建立。

WPD可用于整合多个分解层级以重建原始信号（Kutlu和Kuntalp，2012）。
270 生物电子学与医疗设备

双树复小波变换

DTCWT包含两个实数值。由于变换中使用的下采样过程，普通DWT具有移变特性。因此，输入信号的微小变化可能导致输出端出现完全不同的一组小波系数。为此，金斯伯里(1998)提出了DTCWT这种新的小波变换。我们可以利用为实离散小波变换应用开发的软件和硬件，来构建新的高效基于小波的算法，特别是用于那些无法有效使用DWT的应用场景（塞莱尼克、巴拉尼乌克和金斯伯里，2005）。

DTCWT是离散小波变换的一种现代改进，具有显著的新特性。DTCWT在二维情况下具有方向选择性，并且几乎是移位不变的。本质上，多维DTCWT是不可分割的，但它依赖于计算上足够高效且可分离的滤波器组（多贝西，1992；塞莱尼克等人，2005）。

DTCWT采用两个实离散小波变换。其中一个离散小波变换表示变换的实部，而另一个离散小波变换表示变换的虚部。这两组滤波器是联合设计的，使得整个变换接近解析。需要注意的是，这些滤波器是实的，因此在实现 DTCWT时不需要复数运算。还应注意，DTCWT不是一种临界采样的变换，在一维情况下其计算代价是两倍，因为总的输出数据率是输入数据率的两倍。

DTCWT的逆变换非常简单，与正向变换类似。我们只需将实部和虚部分别进行逆变换即可实现整体逆变换。我们使用这两个实离散小波变换的逆变换来获得两个实信号。我们可以从实部或虚部恢复原始信号x(n)，但这样的逆 DTCWT不具备解析小波变换所具有的全部效益（Selesnicket al., 2005）。

降维方法

降维是一种在保留最具区分性的信息并消除其余无关信息的同时，降低原始特征向量维度的过程，以减少分类器的计算时间（Phinyomark等，2013）。大多数特征提取方法会产生冗余特征。实际上，为了提高分类器性能并实现最小分类误差，必须应用某些特征选择/降维方法来生成一组新特征。已有多种方法被用于降维和特征选择，以获得更高的分类准确率（Wołczowski& Zdunek,2017年）。

应降低脑电图信号的维度，以分析数据并获得更准确的结果。通过不同方法使用少量参数来降低脑电图信号的维度。此外，必须尽量减少特征或维度，以实现更高的分类准确率。为了

例如，WPD或DTCWT生成小波系数，以定义信号能量在时域和频域中的分布，并使用一组小波系数来表征脑电图信号。由于基于小波的特征提取工具所产生的特征向量过大，无法直接作为分类器的输入，因此必须采用降维技术从小波系数中提取更少数量的特征。近年来，已采用多种降维方法进行降维，如李雅普诺夫指数、高阶统计量和熵。近似熵是一种复杂度度量，可应用于噪声数据集，且优于谱熵、KolmogorovSinai熵和分形维度。样本熵对数据长度的依赖性较小。模糊熵是另一种基于模糊集理论的复杂度度量。另一种降维方法是利用子带的一阶、二阶、三阶和四阶统计量。降维后的特征集由小波分解的子带计算得到。在脑电图信号分类中实现了六个统计特征：

每个子带中信号系数的平均绝对值
每个子带中信号系数的平均功率
每个子带中信号系数的标准差
相邻子带信号系数的绝对均值比
每个子带中信号系数的偏度
每个子带中信号系数的峰度

机器学习方法

脑机接口中的主要任务是脑电图信号模式的分类。受试者在执行心理任务时会产生特定的大脑模式，这些模式取决于心理状态，脑机接口应用会检测/分类这些模式并将其转换为适当的指令。在精确时间框架内与脑机接口交互时，分类方法被简化。受试者在此时间框架内执行特定的心理任务（格赖曼等人， 2009）。由于脑电图信号包含大量数据，分类的关键问题是如何表征脑电图记录。首先，必须从获取的脑电图信号中提取显著特征，然后降低这些特征的维度，最后一步是使用降维后的特征进行分类。在分类过程中，类别标签被分配给一组数据的提取特征。实现分类的算法称为分类器。分类器通过训练集学习如何对特征向量进行类别划分。用于分类过程以预测类别标签的算法包括逻辑回归、朴素贝叶斯分类器、k‐近邻、线性判别分析、支持向量机、决策树算法、随机树、随机森林、旋转森林（RoF）、人工神经网络（ANN）等（Siuly等， 2016）。

人工神经网络

人工神经网络由一组连接单元组成，其中每个连接都包含一个相关的权重。人工神经网络通过调整这些权重来学习。

272 生物电子学与医疗设备

学习步骤用于预测实例的正确类别标签。人工神经网络对噪声数据具有容忍性，且能够分类未见过的模式。存在多种类型的神经网络算法和神经网络。反向传播是最著名的人工神经网络算法，它在多层前馈神经网络上实现学习，该网络由一个输入层、一个或多个隐藏层以及一个输出层组成。激活函数应用于加权输入。类别预测可以被建模为输入的非线性组合。学习通过反复处理训练数据集来实现，并将网络对每个实例的预测结果与实际目标值进行比较。网络权重被调整以最小化每个训练实例的预测值与实际目标值之间的均方误差。权重的调整沿每个隐藏层“向后”方向进行，直到第一个隐藏层，因此得名反向传播（韩,裴,&坎伯,2011）。

k‐最近邻

k‐近邻通过训练集中k个实例的类别多数来对未标记实例进行分类。k‐近邻包含三个主要元素：一组带标签的实例、用于计算数据点之间距离的相似性度量，以及最近邻的数量（即k）。为了预测一个无标签实例，需通过计算该实例与带标签实例之间的距离来确定其k个最近邻。然后，利用这些最近邻的类别标签来确定该实例的类别标签。距离度量的选择是另一个关键点，因为最关键的度量是找到两个实例之间的较小距离（吴等,2008）。

支持向量机

支持向量机是机器学习方法中最准确且最稳健的分类算法之一。SVM确定最佳分类函数以区分训练数据中的两类。线性分类函数可以分离出一个超平面，该超平面穿过两个线性可分数据集的中间，从而将两类分开。由于可以找到多个这样的线性超平面，因此通过最大化两类之间的间隔来寻找最优超平面。尽管可以找到无限多个超平面，但只有少数几个才是有效解。因此，SVM试图寻找具有最大间隔的超平面，以实现最佳的泛化能力。此外，这也将实现在训练数据上获得最佳的分类性能（吴等,2008）。

分类与回归树

分类与回归树（CARTs）是机器学习和人工智能领域发展的一个里程碑。CART引入了对树结构数据分析的深入讨论。CART可以通过递归划分来处理连续和名义属性。树的大小可以最大化

273 脑电图控制的辅助设备

在不停止的情况下扩展到最大程度，然后通过代价‐复杂度剪枝回溯到根节点。该过程生成保持分类器属性变换的不变树。在CART中，使用独立测试数据并通过交叉验证持续检查树的性能，而不使用任何基于训练数据的内部性能指标来进行树的选择。CART采用自动缺失值处理、自动类别平衡，并支持概率树估计和动态特征构建（吴等人，2008）

C4.5决策树

C4.5创建一种决策树分类器，类似于以更易理解的规则集形式构建分类器。C4.5首先通过实施分治算法生成初步树。C4.5采用两种启发式准则，即信息增益和增益率。为避免过拟合，对初步树进行剪枝。剪枝算法从叶到根应用，依据是错误率的不良估计。将各分支的估计误差相加，并与用叶节点替代子树时的错误率进行比较。根据比较结果，决定是否剪枝该子树。此外，还会检查估计误差，若用其中一个分支替代子树，则相应地调整树结构（吴等人， 2008）。

REP树

REP树通过采用方差减少/信息增益来创建决策树，并基于减错剪枝对树进行剪枝。当优化速度时，REP树仅对具有数值属性的实例进行分类。此外， REP树可以通过将实例分割成若干部分来处理缺失值。可以设置分裂的训练集方差最小量、每叶实例最小数量、最大树深度以及剪枝的折数（霍尔、威滕和弗兰克，2011）

交替决策树

ADTree使用提升方法创建交替决策树，其中提升迭代次数可根据数据集的复杂度进行调整以实现准确率的权衡。每次迭代向树中添加两个预测节点和一个分裂节点。穷举搜索是默认搜索算法；其他算法为启发式算法，速度明显更快（韩等人，2011）。

随机树分类器

随机树是一种集成学习算法，通过装袋生成多个独立的学习器，以产生随机数据集来构建决策树。在普通树中，节点通过变量之间的最佳分割进行划分。随机树作为树分类器的集成，接收输入特征

274 生物电子学与医疗设备

向量，并使用森林中的每棵树进行预测，采用多数投票方式。通过树多样性与随机化，单决策树的性能得到显著提升。首先，对于每棵单树，训练数据被有放回重采样，并且在每个节点仅采用所有属性的一个随机子集，而不是始终计算每个节点的最佳分割。随机树利用该结果进行分割选择，从而生成实际中平衡的树；因此优化过程得以简化（Hall等，2011；Kalmegh，2015）

随机森林

随机森林是由树分类器组成的混合体，其中每棵树依赖于独立采样的随机向量，且森林中的所有树具有相同的分布。随着森林中树的数量增加，森林的泛化误差趋近于一个极限值。该泛化误差取决于森林中各个树之间的相关性以及它们的强度。采用随机特征选择方法。节点分裂达到的错误率可与AdaBoost相媲美，因此对噪声更具鲁棒性。使用内部估计的误差、相关性和强度来展示增加分裂过程中所使用特征数量的影响（Breiman，2001）

旋转森林

RoF是一种基于特征提取的分类器集成方法。基分类器的训练数据通过将特征集随机划分为K个子集后生成，然后使用主成分分析（PCA）来保留数据中的多样化信息。通过采用特征提取方法，利用旋转方法的概念来提升个体准确性和多样性。由于决策树对特征轴的旋转较为敏感，因此被选为基分类器，从而命名为“森林”。为了保证准确率，保留所有主成分，并使用整个数据集来训练每个基分类器（Rodriguez,Kuncheva&Alonso,2006）。

结果

K折交叉验证是一种在数据有限情况下常用的实用方法，用于评估分类器性能。在交叉验证中，事先确定数据的固定数量划分或折数。在交叉验证过程中，数据集被划分为k个子集，使得每个类别大致具有相同的大小。每次轮流保留一个子集，并在其余的九十分之九数据上训练分类算法，然后在预留集上计算分类器错误。因此，学习过程总共被执行

275 脑电图控制的辅助设备

在不同的训练集上进行k次。最后，为了计算整体误差估计，将k个误差估计取平均值（Hall等，2011）。

真阴性（TN）和真阳性（TP）是正确的分类，而假阳性（FP）是指结果被错误地分类为阳性但实际上为阴性，假阴性（FN）是指结果被错误地分类为阴性但实际上为阳性（Hall等，2011）。生物医学研究人员描述了用于分类器性能的参数，例如召回率和精确率：

$$
\text{Recall} = \frac{TP}{TP + FN}
$$

$$
\text{Precision} = \frac{TP}{TP + FP}
$$

另一个性能度量指标是F值，其表示如下：

$$
\text{F-measure} = \frac{2 \times \text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} = \frac{2 \times TP}{2 \times TP + FP + FN}
$$

最后，当然还有总体成功率：

$$
\text{Accuracy} = \frac{TP + TN}{TP + FN + TN + FP} \times 100\%
$$

一种评估分类器性能的图形方法称为受试者工作特征（ROC）曲线。ROC曲线表示分类器的性能，而不考虑错误成本或类别分布。纵轴代表真阳性率，横轴代表真阴性率。有时会使用ROC曲线下面积（AUC），因为面积越大，模型性能越好。当类别分布和成本未知，并且选择一个模型来代表所有情况时，AUC非常方便（Hall等，2011）

卡帕统计量是一种考虑了预期数值的度量，它通过从分类器的成果中减去偶然性因素，并将结果表示为分类器总和的一个百分比。因此，卡帕统计量表示观测值与预测类别之间的一致性，同时对偶然发生的一致性进行调整。然而，与简单的成功率不同，它并未考虑各类成本（Hall等，2011）

事件相关电位P300脑计算机接口数据库的实验结果

基于ERPP300的BCI数据集可公开在PhysioNet网站上获取（Goldberger等， 2000；“PhysioNet”，2017）。基于ERPP300的BCI数据集曾被

276 生物电子学与医疗设备

由Citi,Poli和Cinel(2010)生成。该数据集是在旨在检测基于事件相关电位的脑机接口功能限制因素的研究过程中产生的，目的是提高脑机接口的传输速率和效益。在记录该数据集时，要求每位参与的受试者使用图11.4所示的标准矩阵拼写器完成20个符号的拼写任务。ERP脑机接口数据集中的所有记录均由信号、触发信号和标注组成，相当于一次运行即一个符号的拼写过程。目标符号在每次运行开始前随机选定。6×6矩阵拼写器的每一列和每一行均以随机顺序闪烁，每次闪烁持续100毫秒，间隔50毫秒，从而产生150毫秒的刺激起始异步时间（SOA）。在整个运行过程中，每列和每行大约被增强20次。记录期间，要求参与者集中注意力于目标符号，并在感知上计数目标符号被增强的次数。运行结束后，要求参与者报告其最终计数值（Goldberger等，2000）。

记录过程中，参与者保持舒适坐姿，颈部由旅行枕支撑以减少肌电伪迹。参与者与具有60赫兹刷新率的22英寸LCD屏幕之间的距离为80厘米。采用 BioSemiActiveTwo脑电系统进行数据采集，采样频率为2048赫兹。系统包括64通道脑电电极、用于定位的两个耳垂以及用于伪迹检测的垂直和水平眼电图（Citi etal., 2010）。

对于P300检测，使用了基于事件相关电位的脑机接口数据库。脑电图信号的采样频率为2048赫兹。每个刺激持续100毫秒，随后是50毫秒间隔，总刺激间隔为150毫秒。采用长度为204个样本（5100毫秒）的矩形窗进行脑电片段提取。无重叠

277 脑电图控制的辅助设备

用于提取这些片段。从记录中提取了所有的信号样本。每位受试者拼写了20个不同的字符，每个字符产生20条不同的记录。每条记录中的行和列均被增强 20次，总共产生240个刺激（行被增强120次，即20×6；列也被增强120次，即20×6，总计120+120=240个刺激）。由于P300仅在某一行和某一列中各出现一次，因此每条记录包含40个P300波刺激和200个其他刺激。因此，对于每位受试者，总共提取了800个P300波刺激和4000个其他刺激。

该数据集通过10折交叉验证用于评估分类器的性能。众所周知，脑电图数据容易受到噪声影响，因此需要使用滤波技术。为了消除噪声，应用了多尺度主成分分析（MSPCA）。本研究中用于评估所提出系统性能的数据集包含12 名受试者中每名受试者的20条记录。每条记录平均包含150个刺激，其中当目标字母被增强时有20个刺激。由于每个刺激的持续时间为150毫秒，其中包含 50毫秒的间隔，第一步任务是仅保存每个刺激的前100毫秒。完成此步骤后，需要从150个刺激中找出这20个目标刺激，并将其与非目标刺激分开存储。在生成目标和非目标时段这两个类别后，对每条记录应用DTCWT进行特征提取。对于每位受试者，创建了一个数据集，其中包含使用DTCWT方法提取的所有 20条记录的全部特征。

不同分类器在P300数据集上的实验结果如表11.1所示。从表中可以看出， RoF相较于其他分类器表现出略高的性能。此外，还可以看出平均准确率较为理想（即在P300检测中使用RoF分类器获得了90.25%的准确率）

表11.1P300脑计算机接口数据集的实验结果

	k-NN				ANN				SVM					C4.5
	准确率 (%)	F – measure	ROC Area	卡帕	准确率 (%)	F – measure	ROC Area	卡帕	准确率 (%)	F值	ROC Area	卡帕	准确率 (%)	F值	ROC面积	卡帕
S1	71.00	0.422	0.653	0.42	89.38	0.788	0.963	0.7875	84.75	0.847	0.848	0.695	68.38	0.417	0.682	0.3675
S2	79.00	0.79	0.79	0.58	87.88	0.947	0.7575	0.7575	84.88	0.849	0.849	0.6975	64.00	0.634	0.651	0.28
S3	70.88	0.709	0.788	0.4175	92.88	0.929	0.978	0.8575	83.13	0.831	0.831	0.6625	71.38	0.452	0.61	0.4275
S4	69.00	0.688	0.761	0.38	83.88	0.839	0.91	0.6775	79.25	0.792	0.793	0.585	72.88	0.729	0.745	0.4575
S5	71.00	0.698	0.8	0.42	77.00	0.77	0.831	0.54	83.75	0.837	0.838	0.675	81.75	0.818	0.82	0.635
S6	89.50	0.894	0.984	0.79	99.00	0.99	0.999	0.98	98.38	0.984	0.984	0.9675	96.88	0.969	0.974	0.9375
S7	76.88	0.768	0.855	0.5375	91.63	0.916	0.965	0.8325	87.63	0.876	0.876	0.7525	88.25	0.882	0.883	0.765
S8	100.00	1	1	1	100.00	1	1	1	100.00	1	1	1	99.88	0.999	0.999	0.9975
S9	78.63	0.78	0.883	0.5725	95.00	0.95	0.983	0.9	90.00	0.899	0.9	0.8	85.40	0.864	0.867	0.7275
S10	73.00	0.725	0.84	0.46	93.00	0.93	0.98	0.86	85.63	0.856	0.856	0.7125	83.25	0.833	0.837	0.665
S11	77.38	0.773	0.855	0.5475	94.00	0.94	0.984	0.88	85.63	0.856	0.856	0.7125	83.63	0.812	0.885	0.625
S12	64.50	0.64	0.711 0.29	0.711 0.29	75.88	0.758	0.827	0.5175	74.00	0.74	0.74	0.48	70.88	0.709	0.696 0.4175	0.696 0.4175
AVG	76.73				89.96				86.42				80.54

| |CART||||AD||||随机森林||||旋转森林|||
| —|—|—|—|—|—|—|—|—|—|—|—|—|—|—|—|—|
| |准确率 (%)|F值|ROC Area|卡帕|准确率 (%)|F – measure|ROC面积|卡帕|准确率 (%)|F值|ROC面积|卡帕|准确率 (%)|F值|ROC面积|卡帕|
| S1|81.25|0.626|0.908|0.625|76.88|0.769|0.776|0.5375|84.13|0.68|0.932|0.6825|85.50|0.71|0.93|0.71|
| S2|80.88|0.809|0.898|0.6175|64.00|0.634|0.651|0.28|83.88|0.839|0.922|0.6775|82.63|0.826|0.921|0.6525|
| S3|83.13|0.831|0.914|0.6625|71.38|0.706|0.685|0.4275|88.88|0.889|0.96|0.7775|91.50|0.915|0.983|0.83|
| S4|79.25|0.792|0.876|0.585|57.63|0.485|0.563|0.1525|80.13|0.801|0.882|0.6025|85.00|0.85|0.935|0.7|
| S5|81.50|0.815|0.89|0.63|83.00|0.83|0.903|0.66|85.00|0.85|0.929|0.7|87.25|0.872|0.942|0.745|
| S6|98.00|0.98|0.994|0.96|98.00|0.98|0.996|0.96|98.50|0.985|0.999|0.97|99.25|0.992|1|0.985|
| S7|88.25|0.882|0.947|0.765|85.63|0.856|0.921|0.7125|89.63|0.896|0.955|0.7925|92.00|0.92|0.976|0.84|
| S8|100.00|1|1|1|100.00|1|1|1|100.00|1|1|1|100.00|1|1|1|
| S9|88.50|0.866|0.946|0.77|85.88|0.859|0.907|0.7175|84.13|0.84|0.912|0.6825|92.25|0.922|0.98|0.845|
| S10|87.00|0.87|0.943|0.74|78.63|0.786|0.87|0.5725|79.00|0.789|0.893|0.58|92.75|0.927|0.985|0.855|
| S11|85.13|0.851|0.923|0.7025|82.38|0.824|0.894|0.6475|83.00|0.83|0.909|0.66|94.50|0.945|0.987|0.89|
| S12|71.13 0.711|71.13 0.711|0.783 0.4225|0.783 0.4225|71.25|0.712|0.783|0.425|69.13|0.691|0.764|0.3825|80.38|0.803 0.882|0.803 0.882|0.6075|
| AVG|85.33||||79.55||||85.45||||90.25||||

信号时，RoF分类器的F值、ROC面积和卡帕值等其他指标也表明其P300检测性能令人满意。

运动想象脑计算机接口数据集的实验结果

本实验使用了脑机接口竞赛III数据集IVa（Blankertz等人，2006；竞赛III， 2005），该数据集包含二类运动想象。实验选取了五名健康受试者，执行右手和右脚的运动想象任务，且不提供反馈。脑电图信号记录过程中共使用了118个电极，采集到的脑电图信号经过0.05至200赫兹的带通滤波。每位受试者每项任务执行 140次试验，因此每位受试者共有280次试验。每次试验（无论是右手还是右脚的运动想象任务）持续3.5秒。脑电图信号以1千赫兹采样，随后下采样至100赫兹。

在所提出的信号处理过程的第一步中，采用MSPCA算法对脑信号进行去噪。考虑到脑电图信号的采样率，MSPCA算法的小波分解层数选择为5。细节系数和近似系数通过Sym4小波提取。去噪后，使用具有四层结构的WPD将脑电图信号分解为小波子带信号，从而得到2j5 245 16个子带。采用了多种分类技术，如C4.5决策树、人工神经网络、支持向量机、k‐近邻、随机森林和 RoF。在评估机器学习技术时，采用了10折交叉验证。获得的结果汇总见表 11.2。

对于第一个受试者AA，使用k‐近邻算法获得了最高的分类准确率，为94.88%。支持向量机以88.10%的准确率位居第二。随机森林为80.36%，人工神经网络为75.83%， C4.5为63.57%，REP树以58.93%的准确率排在最后。对于第二个受试者AL，使用k‐ 近邻算法获得了最高的分类准确率，为92.38%。支持向量机以83.57%的准确率位居第二。人工神经网络为77.02%，随机森林为74.76%，REP树和随机树的准确率最低（ 63.81%）。对于第三个受试者AV，使用k‐近邻算法获得了最高的分类准确率，为 88.93%。支持向量机以82.98%的准确率位居第二。人工神经网络为76.55%，随机森林为73.33%，C4.5为59.29%，REP树以57.50%的准确率排在最后。对于第四个受试者AW，使用k‐近邻算法获得了最高的分类准确率，为94.76%。支持向量机以84.52% 的准确率位居第二。随机森林为74.64%，人工神经网络为72.14%，C4.5为60.95%， REP树以58.81%的准确率排在最后。对于第五个受试者AY，使用随机森林算法获得了最高的分类准确率，为98.33%。RoF以97.14%的准确率位居第二。C4.5为95.48%，支持向量机为92.14%，k‐近邻为91.19%，人工神经网络以79.52%的准确率排在最后。

对于全部五个受试者整体而言，使用k‐近邻算法获得了最高的分类准确率，为94.57%。支持向量机以89.60%的准确率位居第二。随机森林为79.81%，人工神经网络为67.40 %，C4.5为63.55%，REP树以61.12%的准确率排在最后。

279 脑电图控制的辅助设备

从结果可以得出结论：对于所采用的MSPCA和WPD框架，k‐近邻在四个受试者上实现了最佳的分类性能，而随机森林在第五个受试者上提供了最佳的分类结果。此外，k‐近邻在五个受试者总体上也取得了最佳的分类结果。所获得的结果鼓励进一步开发所提出的框架，以应用于各种运动想象指令识别任务中。