推特社交垃圾邮件活动检测
1. 引言
随着在线社交网络(OSN)的广泛普及,垃圾邮件发送者利用这些平台传播垃圾信息。社交垃圾邮件借助用户之间的社交关系,比传统的垃圾邮件方式(如电子邮件垃圾邮件)更为成功。检测垃圾邮件是打击垃圾邮件的首要关键步骤。
目前,推特是最受欢迎的微博客网站,拥有2亿用户,也遭受了各种垃圾邮件攻击。传统的推特垃圾邮件检测方法主要检查单个推文或账户是否存在垃圾邮件。然而,推文级别的检测会消耗大量计算资源,难以满足实时要求;账户级别的检测则陷入了与垃圾邮件发送者创建新账户的无休止博弈中。
本文将视角从个体检测转变为集体检测,专注于检测在推特上操纵多个账户传播垃圾邮件的活动。这种方法不仅高效,能够检测多个现有和未来的垃圾账户,还具有鲁棒性,可以检测到个体层面难以发现的集体垃圾邮件行为。
2. 相关工作
2.1 推特与相关社交垃圾邮件检测
用户在推特上发布的文本消息称为推文,长度最多140个字符,这限制了垃圾邮件发送者在推文中包含的内容。因此,在推文中嵌入外部URL成为吸引用户访问垃圾网站的常用手段。此外,推文的一些文本特征也被垃圾邮件发送者滥用,如话题标签(#)和提及(@)功能。
传统的垃圾邮件方法包括发送垃圾邮件和创建垃圾网页内容。近年来,在线社交网络迅速崛起,由于系统开放和用户众多,成为社交垃圾邮件发送者的理想目标。社交垃圾邮件利用用户之间的社交信任,成功率远高于传统方法。
为应对这一问题,推特发布了反垃圾邮件和滥用规则,违反规则的账户将被永久停用。现有检测方法主要依赖URL特征,将具有相同最终着陆URL的相关消息聚类为一个活动,然后在URL黑名单中查找
超级会员免费看
订阅专栏 解锁全文
33

被折叠的 条评论
为什么被折叠?



