标题:Augmenting Deep Learning with Adversarial Training for
Robust Prediction of Epilepsy Seizures
Abstract:
癫痫是一种慢性疾病,涉及异常的大脑活动,导致患者失去对意识或运动活动的控制。因此,在癫痫发作之前检测出癫痫发作前的状态可以挽救生命。这个问题是具有挑战性的,因为很难区分在频前状态的脑电图信号和正常频间状态的信号。有三个关键的挑战是以前没有解决的:(1)预测模型在患者之间的表现不一致,(2)缺乏完美的预测来保护患者免受任何事件的影响,以及(3)用于推进机器学习(ML)方法的临界前标记数据数量有限。本文通过一种新颖的方法解决了这些限制,该方法使用对抗性示例,并对带有门控循环单元的组合卷积神经网络进行了优化调整。
与目前的技术水平相比,结果表明,模型鲁棒性提高了3倍,曲线下面积(AUC)的变化减少了,AUC精度平均提高了6.7%。该方法在机器学习和癫痫预测领域的其他进展(包括高斯噪声数据增强和多任务学习)中也表现出优异的性能。
1 Introduction
本文解决了这些挑战,并介绍了一些贡献:
用脑电图时间序列数据增强对抗实例(AE)用于癫痫发作预测。对于机器学习领域来说,AE并不陌生,但它在癫痫数据生成方面的应用是新的。该方法有助于确保模型在数据变化的情况下得到训练时的稳健性。随着更多的训练数据变得可用,该方法也有助于克服训练数据的限制。
虽然卷积神经网络(CNN)和门控递归单元(GRU)的选择对于时间序列来说并不新鲜,但它在癫痫以及癫痫发作预测组件优化方面的应用是新的:(1)时间处理,仔细选择时间窗口,同时检查数据的稳定性,以确保窗口足够大,能够捕捉到所需的模式,同时确保不同时间窗口的一致性。(2)层的具体选择是通过调整过程选择的,以确保最高的准确性,同时保持曲线下面积(AUC)达到的所需稳健性。由此产生的网络拓扑不同于先前的工作。(3)通过用独特的患者数据进行训练并为每个患者生成个体AE,为每个患者开发个体模型。这种方法确保了导出的模型可以在患者之间提供改进的区分。所提出的方法在两个基准数据集上实现了最先进的性能,通过AUC、每小时假阳性率(FPR/小时)和灵敏度进行测量,如下所述。与基于频谱分析的现有技术[36]的比较表明了基于时间的处理的优越性。
在稳健性方面,对于两个基准数据集,结果显示患者之间的差异显著减少。稳健性在两个基准数据组中用几个指标证明,包括:每个数据组中患者的AUC平均标准偏差减少2倍和2.5倍,灵敏度的平均标准偏差减少2倍,每个数据组的AUC范围(患者的最大和最小AUC值之间的差异)减少2.5倍和3倍。就发作前预测的准确性而言,结果显示每个数据集的平均AUC分别提高了2.8%和6.7%。对于每个数据集,灵敏度分别平均提高了3.96%和1.8%。每个数据集的FPR/h分别提高了8%和62.5%。本文的其余部分组织如下:第2节概述了癫痫发作预测的相关工作。第3节介绍了我们提出的方法,第4节包含了实验和结果,并与最先进的技术进行了比较。在第5节中,我们包括了结论和研究结果的总结。
2相关工作
使用机器学习技术进行癫痫分类的相关工作可以分为基于特征的方法和深度学习方法。在每个类别中,研究人员已经检查了癫痫检测和预测的两个不同问题,但通常检查信号中的相似特征。这些方法在这里进一步详述。
2.1基于特征的方法
2.1.1癫痫发作检测:
为特定患者的癫痫发作检测而定制的特征工程技术已经成功实现了非常高的灵敏度89.66%,在21名患者中获得了0.49的FPs/h值[11]和(100%),在相同患者中具有非常低的假阳性率[7,27]。在[31]中,作者开发了一个机器学习框架,能够识别癫痫检测的关键特征。他们使用支持向量机构建患者特异性模型,同时考虑灵敏度、特异性和潜伏期作为性能指标。该工作为癫痫脑电数据预处理以及特征提取和评价方法提供了一种新的途径。尽管这些方法获得了非常高的灵敏度,但它们严重偏向于特定的数据集。此外,它们仅用于癫痫发作检测,而非预测。
为了推广使用MTL的癫痫发作检测,在[38]中提出了基于特征的患者特异性MTL-SVM模型。提取的特征是通过使用频率范围为0.5至25 Hz的四个滤波器组对每个通道的EEG信号进行滤波,然后类似于[31]中所做的工作计算每个频带内的能量而获得的。此外,所提出的模型被开发来学习各种患者特异性癫痫发作的一般表示,以便更好地推广到所有不同类型的患者特异性癫痫发作。虽然这项工作的目标是提高模型的可推广性,但模型的特征不足以预测癫痫发作,因为它们仅包括来自滤波器组频带的能量特征,不足以检测代表发作前状态的EEG信号的变化。
2.1.2癫痫发作预测:
癫痫发作预测的主要目标是检测发作间期和发作前状态之间的过渡期,称为发作前状态[12]。在以前的工作中,使用机器学习方法探索了用于癫痫发作预测的不同信号处理技术。例如,在[10]中,探索了用于癫痫发作预测的频域和时域特征组合的合理性。提出的特征向量包括自回归拟合误差、去相关时间、能量、迁移率和复杂度、δ、θ、α、β和γ频带中的谱功率、谱边缘(功率、频率)、四个矩(均值、方差、偏斜度、峰度)、六个分解级的能量小波系数。对216名患者测试了所提出的方法,并且对所有患者实现了38.47%的灵敏度和平均0.2 FPR/小时,而仅对24名患者实现了统计显著性。在[28]中,EEG信号段被过滤以获得四个频带,即δ、θ、α、β和γ。从每个频带中提取以下特征:1)归一化谱功率特征2)四个矩3)活动性、移动性和复杂性特征4)信号的累积能量5)拟合10阶AR模型产生的自回归(AR)误差6)去相关时间7)谱边缘功率8)小波系数。此外,实验还包括确定发作前时间、标准化方法、平滑和异常值去除的最佳组合。发现平滑、异常值去除和通过每个特征的最大值进行归一化为大多数患者提供了最好的结果。所提出的方法实现了73.9%的平均灵敏度,10名患者的FPR/h平均为0.15。以前的方法主要依赖于单变量特征,而不是从多个通道的组合中提取的多变量特征。例如,在[3]中,提出了双变量谱带功率特征用于癫痫发作预测。所提出的特征在24名患者中实现了75.8%的平均灵敏度和0.1的FPR/h。在[22]中,探索了非线性双变量特征的使用,例如小波同步。此外,所提出的特征实现了71%的平均灵敏度,15名患者的平均FPR/小时为零。
虽然在基于特征的癫痫发作预测的文献中可以找到不同的推荐特征集,但没有特定的特征集被证明是预测癫痫发作的最佳集[2]。此外,所提出的方法需要领域知识,并且对于不同的患者或不同的数据集可能不能类似地执行。
2.2深度学习方法
深度神经网络(DNN)模型,如卷积神经网络CNN和递归神经网络(RNNs),已被证明在从时间序列序列中自动提取特征和学习时间动态方面非常有效[25,40]。在[16]中,研究人员引入了一种自动癫痫检测方法,这种方法对现实生活条件下的噪声具有鲁棒性。他们使用具有时间分布密集层的长短期记忆(LSTM)从EEG信号中自动提取鲁棒特征。在一项预测癫痫发作的模型性能研究中,由[13]进行了全面的比较。有人指出,由CNN和长短期记忆(LSTM)组成的模型在灵敏度和虚警率方面优于(隐马尔可夫模型(HMM)、HMM堆叠去噪自动编码器(SdA)、HMM-LSTM、增量主成分分析(IPCA) -LSTM、CNN多层感知器)。
对于癫痫发作预测,[1]的作者使用由5个卷积层组成的1D-CNN从原始EEG信号进行自动癫痫发作预测。这种方法只在FB数据集[24]上进行了测试。在[18]中,作者提出在将数据馈送到CNN模型之前&#x