社交媒体文本中网络欺凌的检测与分类
1. 引言
近年来,无论肤色、种族、年龄或地理位置如何,在线信息共享变得愈发流行,尤其是Z世代,他们会花大量时间在Snapchat、TikTok、Twitter等社交网络平台上。然而,人们在网络上可以随意发表言论,这使得任何人都可能通过发布诽谤性言论来伤害他人,这些言论还可能像谣言一样传播。
欺凌通常指使用威胁、武力或强迫手段来虐待、恐吓或压制他人,而网络欺凌则是指利用电子设备发送威胁和侮辱性信息,以骚扰或伤害他人。网络欺凌的行为包括发送、发布或分享关于他人的负面、有害、虚假或恶意内容,还可能涉及分享他人的个人隐私信息以使其尴尬或蒙羞。这些行为会对受害者造成诸如焦虑、抑郁、恐惧甚至自杀等负面影响,青少年中的网络欺凌问题已成为一个公共卫生问题。而且,想要清除这些有害内容往往非常困难。
由于网络交流的自由性和广泛性,网络欺凌已成为互联网的一大威胁,因此有必要开发基于模式的方法来识别和预防网络欺凌。本研究的目标是使用机器学习技术检测和分类社交媒体文本,将其分为基于年龄、宗教、种族、性别等的网络欺凌内容或非网络欺凌内容,这有助于识别社交媒体帖子中具有心理伤害性的内容,并标记其发布者。
2. 相关前期工作
在技术和互联网出现之前,对传统(身体)欺凌及其影响的研究已经进行了约40年。随着20世纪90年代个人电脑的普及,研究重点从传统欺凌转向了网络欺凌。直到网络欺凌开始导致严重后果,如绝望甚至死亡,它才真正引起人们的关注。
此前已经有许多关于网络欺凌检测和预防的研究方向和模型。例如,一些研究关注儿童使用互联网发送即时消息、电子邮件和社交网络的频率,以及他们在网络上遭受骚扰的经历,包括反复发送相同
超级会员免费看
订阅专栏 解锁全文
39

被折叠的 条评论
为什么被折叠?



