数据集申请方法及简单介绍
DEAP:Database for Emotion Analysis using Physiological Signals,即使用生理信号进行情绪分析的数据库。生理信号区别于情感照片、行为动作等易伪装信号,主要包括设备对人体采集的自主神经或中枢神经的信号。该数据集由英国Sander Koelstra等人团队建立的公开多模态数据库,官网,数据集介绍论文,申请方法见评论区。
数据集介绍
采集了32名(16名男性和16名女性)健康参与者的脑电数据。参加实验的人身体和心理都是健康状态,分别在他们大脑的额叶、顶叶、枕叶和颞叶四个区域采用“10-20”国际导联标准的 **32 导联(见电极分布图)**电极帽采集脑,在 512Hz 采样频率下采集被试者的 EEG 信号。所有被试均被要求在观看完视频后,按照从 1~9 的大小关系,标记所观看视频的 Valence(效价)、Arousal(唤醒度)、Dominance(优势度)的大小。每个样本数据长 63s。实验数据一般选取官网可下载的预处理( 降采样,去除眼电等噪声) 之后的数据(两个版本:data_preprocessed_matlab文件夹和data_preprocessed_python文件夹,即matlab和python处理后的,格式分别为.mat和.dat),实验数据由32个文件组成,对应32个实验受试者。这些文件包含原始数据的下采样(到128Hz)、预处理和分段版本。每个参与者文件包含两个数组。数据格式如下表:
其中每个.mat文件,包含data域和labels域,data域是40*40*8064
的矩阵,labels是40*4
的矩阵。
data域的40*40*8064
:第一个40是指40次试验,第二个40是指40个通道(前32个是脑电通道),8064是指63*128
(63是采样时间63秒,128是采样频率)。labels域的40*4:其中40是指40次实验,4是指4个维度(依次是valence、arousal、dominance、liking)。
其他可下载数据简单介绍
data_original文件夹
原始数据文件夹,这些信号以Biosemi data format(BDF)的格式存储,这种文件格式可由EEGLAB、Matlab、EDFBrowser等读取。共32个。文件名为s01.bdf~s32.bdf,分别是32名被试者全部的实验数据。
data_slice文件夹
来源于data_original文件夹里的bdf文件,是对bdf中的数据进行分割处理后得到的。
processed_single_epoch文件夹
processed_single_epoch文件夹包含s01-s32,共32个子目录。对应32名被试者。每个子目录有命名如s01_p32_01.set~s01_p32_40.set的文件。可以用EEGLAB读取。以s01_p32_01.set为例说明。s01_p32_01.set是编号为s01的被试者参与的40次实验中顺序为01的情感数据。这个文件里的情感数据时长60s,只包括32个脑电通道。
img_channels文件夹
包含s01-s32,共32个子目录,对应32名被试者。每个子目录又包含01~40,共40个下级目录,对应每名被试者的40次实验。每个下级目录里存放了32张图片,这是将每次实验的32个EEG通道数据转换成的32张时频域谱图。
简单标签处理
在valence和arousal维度上,去除label值在4.8-5.2之间的易混淆数据。得到的以下三个图:从左到右依次为(a)未去除之前;(b)valence上去除;(c)arousal去除
感谢
部分资料学习感谢博文介绍。