社交媒体上网络欺凌的机器学习研究综述
1. 网络欺凌现状与研究背景
近年来,随着在线社交网络(OSNs)的迅速普及,网络欺凌事件屡有发生。网络欺凌是一种针对他人的攻击性行为,受害者可能会出现尴尬、抑郁等症状,甚至可能导致自杀。尽管已经采取了一些措施,如学校互助和宣传视频等,但公众对网络欺凌的认识仍然不足。
同时,越来越多的研究方法被提出以解决网络欺凌问题。从2013 - 2020年,关于欺凌和网络欺凌主题的计算机科学会议或期刊上发表的论文数量呈上升趋势,通过以下查询可以获取相关论文:
- TITLE - ABS - KEY(bullying) AND SUBAREA(comp) AND PUBYEAR > 2012;
- TITLE - ABS - KEY(cyberbullying) AND SUBAREA(comp) AND PUBYEAR > 2012。
2. 网络欺凌研究的不同视角
网络欺凌问题从不同角度进行了研究,主要包括以下四个任务:
1. 二元分类 :将OSN上发布的每条消息分类为是否具有攻击性。网络欺凌检测方法可分为监督学习和无监督学习两类。
- 监督学习 :大多数方法依赖于为监督学习设计专门的特征,这些特征可分为五类:
- 文本特征 :与内容信息的统计分析有关,如n - gram、词性标注、文本长度等。
- 社交特征 :表示用户关系的信息,如关注、粉丝或友谊关系,以及相关统计数据。
- 用户