基于垃圾邮件成本构建阻止列表
1. 引言
随着互联网的飞速发展,电子邮件已成为许多人重要的通信媒介。然而,在两三年内,垃圾邮件问题急剧恶化。据赛门铁克的垃圾邮件统计报告,全球超过60%的互联网邮件被识别为垃圾邮件,其中约80%涉及商业推销(UCE)。除了电子邮件,即时通讯垃圾信息和手机短信垃圾信息也成了问题。
如今,人们正以不同方式开发各种技术来对抗垃圾邮件,这是一场发送垃圾邮件者(垃圾邮件发送者)与阻止者之间的持久战。垃圾邮件发送者常频繁更换邮箱、修改邮件样式、格式或内容以对抗反垃圾邮件技术。但研究发现,垃圾邮件存在经济利益真相,尤其是UCE,即对抗反垃圾邮件技术并发送垃圾邮件的成本应低于收件人极少响应所带来的回报。这种利益使得发送垃圾邮件变得值得,所以垃圾邮件发送者必须在邮件中留下一些真实的联系信息,以便收件人对内容感兴趣时能轻松找到他们。
本文介绍了一种自动识别垃圾邮件中此类真实联系信息实体并构建在线阻止列表的方法。研究了垃圾邮件发送者更改不同类型联系信息的经济成本,并根据该成本为阻止列表开发了高效的搜索算法。在实际应用中,该阻止列表可用于为电子邮件客户端或公司的电子邮件服务器设置个性化的电子邮件过滤器,也可作为基于机器学习方法的内容型垃圾邮件过滤器的特征,以提高其有效性。同样的方法也适用于移动电信的短信服务(SMS)垃圾信息过滤。
2. 识别垃圾邮件中的联系信息实体
电子邮件为人们提供了快速高效的电子通信媒介,但目前仍缺乏足够的安全技术来独立支持电子商务交易。UCE垃圾邮件发送者必须在邮件中提供一些真实的联系信息,否则收件人即使对邮件内容感兴趣也无法联系到他们。
为识别垃圾邮件中的联系信息实体,分析了Spam
超级会员免费看
订阅专栏 解锁全文
59

被折叠的 条评论
为什么被折叠?



