利用行为多样性检测垃圾邮件发送者及大规模存储系统主动容错方案
在当今的网络环境中,在线社交网络(OSNs)面临着垃圾邮件发送者的威胁,而数据中心的存储系统则面临着硬盘故障的挑战。本文将介绍两种解决方案,一是利用行为特征检测OSNs中的垃圾邮件发送者,二是提出大规模存储系统的主动容错方案。
利用行为多样性检测垃圾邮件发送者
- 行为特征提取
- 为了计算条件熵,根据公式2需要确定联合熵H(X, Y)。通过引入马尔可夫模型的转移概率,将数据集样本转化为马尔可夫模型后确定条件熵的最终值。
- 观察绘制的条件熵图可知,大多数垃圾邮件发送者的条件熵值低于1.0,而正常账户中只有不超过10%的账户条件熵值低于1.0。这表明垃圾邮件发送者在发送消息时的模型比正常用户简单得多,通过条件熵可以识别善于改变行为模型的伪装垃圾邮件发送者。
- 特征集合
- 行为特征
- 熵 :正常账户发送消息的行为具有多样性。
- 条件熵 :垃圾邮件发送者发送消息的行为简单。
- 非行为特征
|特征名称|特征描述|
| ---- | ---- |
|粉丝数量|账户的粉丝数量|
|关注列表中的朋友|账户关注列表中的朋友数量
- 行为特征
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



