摘要:这是一本帮助用户使用记录的视频、音频、眼睛注视和生理数据来响应引发情绪的视频剪辑以及媒体标签的感知适当性的手册。
1.介绍
该数据库包含记录的实验,目的是获得关于健康成人自然行为的知识,在多媒体观看过程中与计算机交互,旨在引发对内容的情感反应,如娱乐或厌恶,和/或参与者对所提供内容的同意或不同意。
在实验过程中,参与者的行为被摄像机、麦克风和凝视跟踪器记录下来。此外,参与者的生理反应使用生物电磁干扰主动二号系统记录。Biosemi有源二号系统已被世界各地的许多研究实验室使用。该系统使用光纤(电流隔离)连接到系统的其余部分,电力由电池提供。在实验之前,生理信号传感器,包括使用头罩的脑电图(EEG)传感器、心电图(心电图)传感器、手指上的皮肤电电阻(GSR)传感器、皮肤温度传感器和胸部周围的呼吸带,被连接到参与者的身体上,并要求参与者通过跟随屏幕上的红色圆圈来校准凝视跟踪器。实验由Tobii工作室软件(http://www.tobii.com)控制。实验装置的照片如图1所示。
图1.在实验装置中,六个摄像机正在记录面部表情。修改后的键盘在参与者面前可见。
图2.记录面部表情和头部姿势的6台摄像机拍摄的视频快照。
30名具有不同文化和教育背景的参与者自愿参加,以响应伦敦帝国理工学院全校园的志愿者号召。在30名年轻健康成人参与者中,17名为女性,13名为男性;年龄从19岁到40岁不等(男性= 26.06±标准差= 4.39)。参与者有不同的教育背景,从本科生到博士后,从中级到母语人士,英语水平各不相同。请参考第5节中的使用条款,了解使用数据集的条件。实验方案的细节可以在[3]中找到。
2.记录测量数据的描述
2.1.音频通道。音频包含两个声道的音频。第一通道(或“左”,如果解释为立体声流)包含来自AKG C 1000 S MkIII房间麦克风的音频信号,包括房间噪声以及视频刺激的声音。第二通道包含来自AKG HC 577 L头戴式麦克风的音频信号。第一频道的内容可以用来减少环境声音对任何语言线索处理的影响。由于实验的被动性质,数据中出现的语言线索数量很少。
2.2.摄像机视图。所有摄像机视图的示例如图2所示。摄像机命名为:
摄像机1 = C1触发器;屏幕上方,彩色,图2 (a)
摄像机2 = BW1屏幕上方,单色,图2 (b)
摄像机3 = BW2屏幕下方,单色,图2 ©
摄像机4 = BW3;屏幕下方,单色,图2 (d)
摄像机5 = BW4单色侧视图,图2 (e)
摄像机6 = BW5高角度单色概览,图2 (f)
录制过程中使用了两种类型的摄像机:一种是联合视觉黄貂鱼F-046C,彩色摄像机(C1),另一种是五种联合视觉黄貂鱼F-046B,单色摄像机(BW1至BW5)。空间分辨率均为780x580像素。摄像机经过内部和外部校准。外部校准如图3、4、5、6所示。校准参数见表1和表2。
2.3.生理测量。具有有源电极的生物电磁干扰有源二系统(http://www.biosemi.com)用于采集生理信号。在向参与者显示视频的同时,记录生理信号,包括心电图、脑电图(32个通道)、呼吸幅度和皮肤温度。生理信号使用生物电磁干扰数据格式(BDF)存储,可通过以下方式读取EEGLAB,Matlab,EDFBrowser等。传感器连接位置和协议详情见[3]