基于语音和神经网络的抑郁与酒精 intoxication 检测研究
1. 引言
在当今社会,酒精消费问题依然严峻。据世界卫生组织(WHO)统计,每年约有 300 万人因酒精消费死亡,占总死亡人数的 5%;在 20 至 39 岁人群中,这一比例更是高达 13.5%。酒精会导致反应迟缓、思维模糊、行为偏离规范等,在交通、建筑等领域可能引发严重后果。目前检测酒精 intoxication 的方法,如身体协调练习或血液酒精含量检测,要么需要专业医学知识,要么需要昂贵设备,且准确性参差不齐。因此,开发一种简单、经济且准确的语音分析系统来检测酒精 intoxication 具有重要意义。同时,利用语音数据自动分类抑郁也成为研究热点,通过分析语音中的节奏共振峰(RFs)有望捕捉到与抑郁相关的关键模式。
2. 相关研究
2.1 酒精对语音的影响
饮酒会对人的注意力、反应和思维产生负面影响,进而导致语音变化,如停顿增加、发音拉长或声音改变。研究表明,饮酒会改变响亮声音的发音,尤其是“s”音,且不同程度的 intoxication 影响程度不同。当 intoxication 水平高于 1.5‰ 时,语音变化可被人耳察觉,但酒精对每个人的影响因生理特征(如体重、身高、年龄等)而异。
2.2 语音分析用于 intoxication 检测的研究现状
利用人类语音分析 intoxication 的研究已经开展了很长时间,但尚未有成熟产品问世。例如,有研究考虑了电话交谈中语音识别的四种方法,其中并行 PRLM 达到了 2% 的最低错误率。此外,还有两种考虑酒精影响的方法:一是将 intoxication 视为语音状态的一种,可改变语音语调
超级会员免费看
订阅专栏 解锁全文
16

被折叠的 条评论
为什么被折叠?



