基于节奏共振峰分析的自动抑郁症分类研究
1. 引言
抑郁症作为一种影响全球数百万人的心理健康障碍,因其复杂的性质和多样的症状,给临床医生和研究人员带来了巨大挑战。准确及时地诊断抑郁症对于有效治疗和干预至关重要。目前,临床医生主要依靠访谈、自我报告问卷和精神评估等方法来诊断抑郁症,但这些方法具有主观性且容易产生偏差,可能导致误诊或延误治疗。
语音作为抑郁症检测的潜在手段,相较于传统诊断方法具有诸多优势。它是人类交流的基本方式,能够反映各种情感和认知状态。过去,研究人员已经提出了许多声学特征,如低水平描述符(LLDs),用于捕捉抑郁症患者语音中的模式。此外,结合高斯混合模型(GMM)的特征分析以及功率谱密度在多个子带内的分析,也被证明在处理抑郁症和非抑郁症语音样本的模式方面是有效的。同时,深度学习与手工特征的结合也被用于提高抑郁症检测的性能。
本文旨在探索节奏共振峰分析(RFA)作为一种新的自动抑郁症分类方法的潜力。通过研究语音节奏模式与抑郁状态之间的关系,为开发客观可靠的抑郁症评估工具做出贡献。相关特征中,梅尔频率倒谱系数(MFCCs)能有效捕捉语音的重要特征,而节奏共振峰(RFs)已被研究人员用于机器学习中对不同说话风格的分类。基于初步研究,我们观察到MFCCs、幅度调制(AM)、频率调制(FM)RFs及其组合在t - SNE图中的排列存在显著差异,这表明这些特征捕获了不同的信息,进一步促使我们使用RFs进行分类任务。
2. 节奏共振峰分析
Gibbon在关于RFA的探索性论文中提出了四个主张,包括语音调制知识、同时共振峰、串行共振峰和不对称节奏。RFA的关键特征是低频(LF)频谱中的频谱峰值,被称为LF节奏共振峰。RFA方法明确关联了每种语言的语
超级会员免费看
订阅专栏 解锁全文
1899

被折叠的 条评论
为什么被折叠?



