探究数据杂质对精神障碍检测的影响
1. 实验细节
- 数据集 :使用 DAIC - WOZ 数据集,包含 189 个虚拟面试官与参与者的音视频交互记录。通过患者健康问卷(PHQ - 8)和创伤后应激障碍检查表(PCL - C)为数据标注,分别用于检测重度抑郁症(MDD)和创伤后应激障碍(PTSD)。若参与者在问卷中的得分超过预定义阈值(PHQ - 8 为 10,PCL - C 为 45),则被诊断为相应疾病。
- 数据集分为训练集(107 人)、开发集(35 人)和测试集(47 人)。
- 健康对照组为未患 MDD 和 PTSD 的参与者数据,非健康对照组为患 MDD 或 PTSD 或两者皆有的参与者数据。
- MDD 检测的二分类器负类包含健康对照组和部分有 PTSD 的参与者数据;PTSD 检测的二分类器负类包含健康对照组和部分有 MDD 的参与者数据。
- 方法 :分析目标人群中另一种相关精神障碍的存在对目标精神障碍检测性能的影响。以 MDD 为主疾病、PTSD 为相关疾病,反之亦然进行实验。
- 提出修改方法:从检测主要精神障碍的二分类器负类中移除相关精神障碍患者的数据。
- 移除操作可在训练集或训练集和开发集上进行,测试集不变。
- MDD 为主疾病时,修改后的训练集和开发集分别包含 98 人和 34 人数据;PTSD 为主疾病时,分别包含 100 人和 31 人数据。
- 以原始分区训练和开发模型作为检
数据杂质影响精神障碍检测
超级会员免费看
订阅专栏 解锁全文
1857

被折叠的 条评论
为什么被折叠?



