题目:
Early depression detection in social media based on deep learning and underlying emotions
基于深度学习和潜在情感的社交媒体早期抑郁症检测
Abstract:
抑郁症是对公共健康的挑战,经常与残疾有关,也是导致自杀的原因之一。许多抑郁症患者使用社交媒体获取信息,甚至谈论他们的问题。一些研究已经提出在这些网络环境中检测潜在的抑郁症用户。然而,效果不理想仍然是实际应用的障碍。因此,我们提出了一种基于卷积神经网络的社交媒体早期抑郁症检测方法,该方法结合了与上下文无关的词嵌入和早晚期融合方法。将表情符号中编码的潜在情绪的重要性考虑在内,对这些方法进行了实验评估。结果表明,所提出的方法能够检测出潜在的抑郁用户,精度达到0.76,与许多基线(𝐹1 (0.71))相比具有同等或更高的有效性。此外,表情符号的语义映射可以获得明显更好的结果,包括更高的召回率和查准率,分别提高了46.3%和32.1%。在基准词嵌入方法下,表情符号语义映射的召回率和查准率分别提高了14.5%和40.8%。就整体有效性而言,这项工作同时考虑了单独的嵌入和基于融合的方法,推进了最先进的技术。此外,研究还表明,抑郁症患者通过表情符号表达和编码的情绪是问题的重要暗示证据,也是早期发现的宝贵资产。
1. Introduction:
抑郁症是一种遗传、生物、环境和心理等多种因素共同作用的心理障碍[1,2]。患有这种疾病的人往往有一系列症状,例如:精力不足、食欲改变、焦虑、注意力不集中、优柔寡断、感觉毫无价值、内疚或绝望。尽管在预防、诊断和治疗方面取得了进步,但抑郁症患者的数量仍在不断增长[2,3]。事实上,抑郁症是全球健康问题和残疾的主要原因。根据世界卫生组织(WHO)最近的估计,全世界有超过3亿人患有此病[2]。报告还显示,2005年至2015年间,病例数量增加了18.4%。抑郁症也是自杀死亡的主要原因,每年自杀死亡人数接近80万[2]。这强调了这种疾病的严重性,以及制定策略以改善诊断和抑制其发展的必要性。
尽管治疗抑郁症的方法有很多,但世界上只有不到一半的患者得到了适当的治疗[3]。许多因素导致治疗缺失,包括缺乏诊断和不准确甚至错误的评估。在这种情况下,需要改进检测抑郁症的过程,这是一个相关的挑战。因此,一个很有前途的补充方案是利用社交媒体中产生的数据。
Facebook、Twitter和Reddit等社交媒体平台的出现,让人们可以直接、全面地分享他们的个人经历、主意或想法。这些发布在社交媒体上的信息除了带有明确的含义外,还包含了关于其作者的隐含信息。因此,如[4]所言,社交媒体也使人们找出个体抑郁症出现的迹象成为可能。
在这种情况下,社交媒体是一种可以用来检测抑郁症患者的资源,尤其是因为患有抑郁症的人往往会隐瞒自己的健康状况,这使得专家很难诊断,但这些信息可能隐藏在社交媒体上发布的内容中。
因此,探索语言在社交媒体上的使用将成为一个很有前途的方向。具体来说,利用社交媒体的早期检测,可以更有效地采取预防措施。对于大规模数据分析任务,既可以使用由专家执行的直接评估方法,也可以使用机器学习等自动化方法[5]。
机器学习在面向模式的困难问题上取得了令人印象深刻的成果[6],例如语音识别、图像和视频中的对象识别以及自然语言处理(NLP)。然而,关于抑郁症的检测,由于难以从社交媒体上的文本中提取判别特征,使用传统的分类方法可能无法成功[7]。最近的替代方案是使用诸如深度学习(DL)之类的高级技术。DL在许多应用中取得了令人惊讶的结果(例如,健康诊断[8]、图像合成[9]和自动驾驶[10])。此外,还处于起步阶段,但深度学习在抑郁症的早期检测方面也显示出了令人鼓舞的结果[11,12]。
早期发现对于抑郁症治疗至关重要,因为它可以采取预防措施来减轻问题,特别是考虑到患者的生命时刻处于危险之中。尽管如此,许多提案只考虑响应性解决方案,而忽略了时间问题。然而,必须考虑到时间因素,因为当受试者明确表现出问题时可能为时已晚,治疗可能无法及时到来,或者生活质量可能已经受到严重影响。
多年来,人们开发了不同的方法来应对社交媒体中的抑郁检测任务,主要集中在文本表示的提取[4,13],主要依赖于基于深度学习的文本嵌入[12,14]。但是,根据在实际环境中部署的预期情况,拟议的办法仍然没有取得令人满意的效果。一个听起来不错的替代方案是使用数据融合策略,旨在根据不同的视图(模型)及其对数据的互补性,捕捉每个系统的最佳效果。然而,对于抑郁症的检测,很少有研究对其进行探索,几乎没有评估组合表征模型的研究。
因此,本研究提出了一种使用DL和早晚期融合方法在社交媒体中检测早期抑郁症的方法。它试图改进识别潜在抑郁用户的过程,并使用不同的词嵌入作为特征表示进行实验评估。总之,本研究的主要贡献有:
- 我们提出了一种新的方法,该方法探索使用早期融合和晚期融合来帮助早期发现社交媒体用户的抑郁症。
- 我们进行了广泛的实验,并证明所提出的方法在各种场景下优于基线。
- 我们展示了表情符号对检测性能的决定性作用,因为它们可以表达用户的感受和情绪。
本文的其余部分组织如下。第2节描述了相关的背景概念。第3节介绍了相关工作,第4节描述了提出的方法。第5节介绍了实验设置。第6节展示了研究结果和讨论。第7节提出挑战和研究方向。最后,第8部分给出了结论和未来的工作。
2. Background
2.1 Deep Learning 深度学习
DL是机器学习(ML)的一个子领域,它通过学习将知识表示为概念的层次结构,以此实现强大的能力和灵活性,每个概念都是根据更简单的概念定义的,而更抽象的表示是根据不太抽象的概念计算的[15]。在传统的学习方法中,人类需要从头到尾对特征进行选择,而深度学习则体现了一种通用的学习过程。DL允许由多个处理层组成的计算模型,以学习具有多个抽象级别的数据表示[16]。
卷积神经网络(CNN)和循环神经网络(RNN)都是深度学习网络的典型案例。CNN在图像、视频、语音和音频处理方面取得了突破[16,17],而RNN在文本和语音等顺序数据处理方面取得了重大进展[18]。最近,一些使用所谓transformer方法的架构在一些任务中优于RNN[19]。尽管如此,使用基于CNN的架构来支持文本处理也取得了很好的效果[20-22],这也是本工作的重点。
CNN是一种专门用于网格拓扑数据处理的神经网络[15]。与其他类型的网络不同,CNN至少包含一层卷积滤波器,其面向局部特征提取[23]。CNN广泛应用于计算机视觉,但也被有效地用于文本分类[24]。
2.2 Word Embedding 词嵌入
词嵌入是一种流行的文本表示方式,并已应用于许多任务,重点是自然语言识别,文档分类和情感分析[25]。词嵌入方法为非结构化文本提供了低维向量表示[26]。它具有强大的泛化能力,并遵循分布假设,捕捉到相似的单词往往出现在相似的上下文中[27]。例如,“绿色”的向量表示比“鞋子”更接近“蓝色”,因为它们都指的是颜色。同样,由于语境的相似性,“罗马”与“意大利”的关系就像“巴黎”与“法国”的关系一样密切。这也应该发生在同义词之间(例如,“dog”和“puppy”,“huge”和“enormous”)。总之,词嵌入代表了一组技术,其中单个词在预定义的向量空间中被表示为实值向量,通常具有数十或数百个维度[28,29]。在本研究中,使用词嵌入对社交媒体上的用户帖子进行特征表示。
2.3 Data Fusion 数据融合
数据融合在不同的环境都有应用,经常被应用于信息分类和检索任务中。如果利用得当,数据融合已被证明可以极大提高系统的有效性[30]。数据融合基本上有三种方法:早期融合、晚期融合和混合融合[31-33]。早期融合过程通常是指在训练或评价阶段之前的一组特征的聚合和/或连接,这些特征可能是基于不同的策略提取的。另一方面,晚期融合过程对一组训练好的分类器所做的决策进行“聚合”。一般来说,当使用晚期融合时,其有效性要优于最好的单个分类器[34]。除了晚期和早期融合方法外,还有介于两者之间的混合融合方法。其中最广泛的方法是高斯过程和自动编码器(经典,深度或变分)。在这项工作中,我们利用了早期和晚期融合方法,而更复杂的混合方法则留给未来的具体研究。
2.4. Language and depression detection 语言和抑郁检测
抑郁症影响着许多人,但不幸的是,大多数人都没有意识到自己的疾病,因此,直到症状变得严重才寻求临床干预。所以,研究抑郁症检测的策略就显得非常重要,尤其是因为它直接影响患者的整体健康状况。通过适当的干预措施,我们可以减少甚至避免抑郁症的影响,而早期发现是决定性的第一步。为了完成这项任务,分析个人使用的语言是一种可能的方案,因为抑郁症和语言使用之间存在关系[35,36]。
几项基于社交媒体中语言使用的研究表明,患有抑郁症的人通常会:(𝑖) 谈论更多的人际关系和生活;(𝑖𝑖) 展现个性;(𝑖𝑖𝑖) 变得更加关心自己;(𝑖𝑣) 使用更多的表情符号、负面情绪和否定词;(𝑣) 多用动词、副词、感叹号和问号;(𝑣𝑖) 经常使用语义强的单词(如脏话);(𝑣𝑖𝑖) 不断回忆过去,担忧未来[37]。
语言是人格、社会或情感状态以及心理健康的有力指标。一些研究表明,可以通过检查语言的使用来预测一个人的精神状态,包括抑郁的证据[4,37,38]。因此,社交