概述
提出了一种基于最小化全局冗余的特征提取算法(global redundancy minimization in orthogonal regression)。
研究动机
基于EEG的情绪识别研究大多使用低密度(小于128个通道)的EEG数据,如SEED [71]和DEAP[72]数据库。低密度脑电图的缺点是其空间分辨率差。随着脑电设备的发展,高密度脑电(超过 128个通道)因其高空间分辨率在情绪识别领域受到越来越多的关注 。与低密度脑电信号相比,高密度脑电信号可以为情绪识别任务提供更丰富的空间信息。但基于EEG的情绪识别数据 [16]、[17]的样本量小,高维EEG特征容易导致分类器过拟合和情识别性能差。
在现有的研究中[26],[47],高度相关特征的特征排名往往是几乎相等的,因为它们被认为对分类任务[26],[47]同样重要 。结果表明,在选取的特征子集中,得分最高的多个EEG 特征相互依赖、互为冗余[48]。由 冗余的EEG特征不能提供额外有用的 信息用于情绪识别,应该被去除[30]。
mRMR[20]和CMIM 方法[49]能在一定程度上最小化所选特征子集中的冗余信息。然而, 因为采用贪心策略评估特征相关性, 因此无法实现全局冗余最小化, 所选择的EEG特征子集不是最优输出 [47],[48]。
解决方案
针对这一问题,文章提出了一种新的EEG特征 选择方法,即基于正交回归的全局冗余最小化(GRMOR)。引入了一个全局冗余评估项来计算EEG特征与其他特征的冗余之和。该方法能有效地从全局角度识别冗余脑电信号 ,进而获得具有鉴别性的非冗余脑电信号特征子集。
GRMOR 方法 将全局冗余信息引入正交回归以准确评估冗余信息 高度相关的 EEG 特征之间的关系。 GRMOR 是最小化以下问题:
minW,b,θ∥WTΘX+b1nT−Y∥F2+λθTAθ s.t. WTW=Ik,θT1d=1,θ≥0 \begin{aligned} &\min _{W, \mathbf{b}, \theta}\left\|W^{T} \Theta X+\mathbf{b} \mathbf{1}_{n}^{T}-Y\right\|_{F}^{2}+\lambda \boldsymbol{\theta}^{T} A \boldsymbol{\theta} \\ &\text { s.t. } W^{T} W=I_{k}, \boldsymbol{\theta}^{T} \mathbf{1}_{d}=1, \boldsymbol{\theta} \geq 0 \end{aligned} W,b,θmin∥∥WTΘX+b1nT−Y∥∥F2

本文提出了一种GRMOR特征选择方法,针对高密度EEG数据中的冗余问题,通过最小化全局冗余实现特征子集优化。方法利用正交回归评估冗余,有效去除冗余特征,提高情绪识别准确性和样本效率。实验在DEAP、SEED和HDED数据集上展示了优于其他算法的结果,但可能不适用于半监督和无监督学习。
最低0.47元/天 解锁文章
938

被折叠的 条评论
为什么被折叠?



