利用表情符号和源滤波器模型提升抑郁检测与语音合成效果
表情符号在基于文本的抑郁检测中的应用
在基于文本的抑郁检测领域,为了更好地解决数据稀缺问题,研究人员采用了任务无关的预训练文本嵌入来表示语义特征。其中,BERT被用于提取高级上下文敏感特征作为语义模态,同时还研究了将BERT和表情符号特征融合,以结合语义和情感模态。
抑郁检测模型
该抑郁检测方法将每个受试者的文本视为句子序列,使用双向长短期记忆(BLSTM)网络对序列数据进行建模。具体流程如下:
1. 特征输入 :网络接收从患者文本中获得的矢量化特征序列 $X_p = [x^{(1)} p, x^{(2)}_p, …, x^{(I)}_p]$ 。
2. BLSTM处理 :将序列 $X_p$ 输入BLSTM网络,输出 $O_p = BLSTM(X_p) = [o^{(1)}_p, …, o^{(I)}_p]$ 。
3. 时间池化 :由于每个对话只给出一次抑郁状态标签,需要使用时间池化层去除时间变异性。这里采用注意力机制作为时间池化方法,为每个时间步 $i$ 计算权重:
- $\alpha^{(i)}_p = \frac{e^{w^T o^{(i)}_p}}{\sum {t} e^{w^T o^{(t)} p}}$ ,其中 $w$ 是可学习的注意力参数。
- 注意力输出 $\hat{o}_p = \sum {i} \alpha^{(i)}_p o^{(i)}_p$ 。
4. 分类预测
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



