DEAP数据集

数据集申请方法及简单介绍

DEAP:Database for Emotion Analysis using Physiological Signals,即使用生理信号进行情绪分析的数据库。生理信号区别于情感照片、行为动作等易伪装信号,主要包括设备对人体采集的自主神经或中枢神经的信号。该数据集由英国Sander Koelstra等人团队建立的公开多模态数据库,官网数据集介绍论文,申请方法见评论区。

数据集介绍

采集了32名(16名男性和16名女性)健康参与者的脑电数据。参加实验的人身体和心理都是健康状态,分别在他们大脑的额叶、顶叶、枕叶和颞叶四个区域采用“10-20”国际导联标准的 **32 导联(见电极分布图)**电极帽采集脑,在 512Hz 采样频率下采集被试者的 EEG 信号。所有被试均被要求在观看完视频后,按照从 1~9 的大小关系,标记所观看视频的 Valence(效价)、Arousal(唤醒度)、Dominance(优势度)的大小。每个样本数据长 63s。实验数据一般选取官网可下载的预处理( 降采样,去除眼电等噪声) 之后的数据(两个版本:data_preprocessed_matlab文件夹和data_preprocessed_python文件夹,即matlab和python处理后的,格式分别为.mat和.dat),实验数据由32个文件组成,对应32个实验受试者。这些文件包含原始数据的下采样(到128Hz)、预处理和分段版本。每个参与者文件包含两个数组。数据格式如下表:
在这里插入图片描述
其中每个.mat文件,包含data域和labels域,data域是40*40*8064的矩阵,labels是40*4的矩阵。
data域的40*40*8064:第一个40是指40次试验,第二个40是指40个通道(前32个是脑电通道),8064是指63*128(63是采样时间63秒,128是采样频率)。labels域的40*4:其中40是指40次实验,4是指4个维度(依次是valence、arousal、dominance、liking)。
在这里插入图片描述

其他可下载数据简单介绍

data_original文件夹

原始数据文件夹,这些信号以Biosemi data format(BDF)的格式存储,这种文件格式可由EEGLAB、Matlab、EDFBrowser等读取。共32个。文件名为s01.bdf~s32.bdf,分别是32名被试者全部的实验数据。

data_slice文件夹

来源于data_original文件夹里的bdf文件,是对bdf中的数据进行分割处理后得到的。

processed_single_epoch文件夹

processed_single_epoch文件夹包含s01-s32,共32个子目录。对应32名被试者。每个子目录有命名如s01_p32_01.set~s01_p32_40.set的文件。可以用EEGLAB读取。以s01_p32_01.set为例说明。s01_p32_01.set是编号为s01的被试者参与的40次实验中顺序为01的情感数据。这个文件里的情感数据时长60s,只包括32个脑电通道。

img_channels文件夹

包含s01-s32,共32个子目录,对应32名被试者。每个子目录又包含01~40,共40个下级目录,对应每名被试者的40次实验。每个下级目录里存放了32张图片,这是将每次实验的32个EEG通道数据转换成的32张时频域谱图

简单标签处理

在valence和arousal维度上,去除label值在4.8-5.2之间的易混淆数据。得到的以下三个图:从左到右依次为(a)未去除之前;(b)valence上去除;(c)arousal去除
在这里插入图片描述

感谢

部分资料学习感谢博文介绍。

一、软件的具体操作 1.建一个文件夹,里面必须有四个文件(Dblank;deapdeap.000;123.dta)前三个文件在一般下载的DEAP Version 2.1中都有,直接复制过来就可以,第四个文件是一个数据文件,一般先在excel中先输入,再复制到一个记事本下就可以,注意在记事本下的数据只有数据,不包括决策单元的名称和投入、产出的名称,并且一定要先放产出,后是投入。例子具体见123子表格和123记事本。 2.对命令Dblank文件进行修改,修改后保存为123.ins文件 3.打开deap软件,运行123.ins 4,回车后自动会有123.out 注意事项:(1) 123.dta;Dblank;123.ins都用记事本打开; (2)数据文件名和命令文件名一定要一样,如例子中都用123 (3)文件夹中一定要包括deap.000文件,如果没有这个文件,打开deap软件,就会出现一闪就没有了的情况。 二,结果的分析 在文件夹中打开123.out,看如下: 1) firm crste vrste scale 1 0.687 1.000 0.687 drs 2 0.814 1.000 0.814 drs 3 0.319 0.709 0.450 drs 4 1.000 1.000 1.000 - 5 1.000 1.000 1.000 - 6 0.336 0.425 0.791 drs 7 0.642 0.648 0.991 irs 8 0.379 0.381 0.994 irs 9 0.702 0.750 0.936 irs 10 1.000 1.000 1.000 - 11 0.304 0.461 0.659 irs 12 0.352 1.000 0.352 irs 13 1.000 1.000 1.000 - 14 0.594 0.929 0.639 irs 15 0.402 1.000 0.402 irs mean 0.635 0.820 0.781 firm:代表例子中的15的样本 crste:技术效率,也叫综合效率 vrste:纯技术效率 scale:规模效率(drs:规模报酬递减;-:规模报酬不变;irs:规模报酬递增) crste=vrste×scale 2) Results for firm: 3 Technical efficiency = 0.709 Scale efficiency = 0.450 (drs) PROJECTION SUMMARY: variable original radial slack projected value movement movement value output 1 7326.380 0.000 0.000 7326.380 output 2 119.910 0.000 0.000 119.910 input 1 15427.000 -4496.010 0.000 10930.990 input 2 5257.970 -1532.371 -1643.828 2081.771 第三个样本的具体分析如下: 纯技术效率=0.709 规模效率=0.450 (drs):规模报酬应该递减 第三个样本的投入产出情况分析: 第一、二产出均没有冗余情况(因为其 radial movement 和 slack movement 均为零) 第一个投入要素有投入冗余4496.010;第二投入要素有投入冗余3176.199=1532.371+1643.828 这个意思是说按第三个样本现在的产出冗余第一个投入要素可以减少4496.010,第二个投入要素可以减少3176.199 Results for firm: 8 Technical efficiency = 0.381 Scale efficiency = 0.994 (irs) PROJECTION SUMMARY: variable original radial slack projected value movement movement value output 1 235.860 0.000 0.000 235.860 output 2 3.760 0.000 6.995 10.755 input 1 777.000 -480.651 0.000 296.349 input 2 132.550 -81.995 0.000 50.555 第八个样本则出现了产出不足的情况,即第二个产出应该比现在增加 6.995 如果投入因素是决策单元可的决定的,而产出因素是不能决定的时,我们分析就可以考虑投入是否能减少,不管产出是否能增加(因为产出是决策单元不可控的因素) 如果产出因素是决策单元可的决定的,而投入因素是不能决定的时,我们分析就可以考虑产出是否能增加,不管投入是否能减少(因为投入是决策单元不可控的因素) 如果样本单元的纯技术效率为1,而规模效率小于1时,这说明样本单元本身的技术效率而言没有投入需要减少、没有产出需要增加;样本单元的综合效率没有达到有效(即1),是因为其规模和投入、产出不相匹配,需要增加规模或减少规模。如例子中的第二个样本单元,其规模应该缩小。
评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值