网络安全与移动应用:钓鱼网站检测与应用可用性分析
1. 钓鱼网站检测概述
网站钓鱼是一种网络诈骗手段,攻击者针对在线用户,诱使其泄露宝贵信息。随着电子商务网站使用需求的增加,网站钓鱼已成为在线用户主要的安全担忧。为有效检测钓鱼网站,我们采用数据挖掘中的关联分类(AC)方法,其具有较高的检测准确率。
钓鱼攻击通常通过伪造邮件、欺诈网站等手段,诱使受害者放弃个人信息。攻击者会通过网站内的点击、邮件附件、虚假链接、即时消息、间谍软件等方式,将用户重定向到不同的网站,还会提供非法网站让用户填写个人信息。
关联分类是一种从训练数据集中定义类别,并将新的类别标签分类到预定义类别或创建新类别组的方法。它基于给定的训练数据集进行训练,并给出预测结果。规则分类算法也称为分治法,是一个迭代过程,即在训练数据集中创建规则子集。
2. 相关研究工作
2.1 检测钓鱼网站的网站特征
网站特征或属性用于识别网站是钓鱼网站还是合法网站,这些特征将数据集分类成不同的组。我们从免费社区网站收集了总共 1353 个钓鱼、合法或可疑的网站数据集,使用朴素贝叶斯和 PART 算法的分类方法对每个特征进行分析。分析后,得到 548 个合法网站、702 个钓鱼网站和 103 个可疑网站的数据集。我们分类出 16 种不同的特征,用于检测钓鱼或合法网站。收集的网站数据集的属性具有分类值和数值,例如“合法为 1”、“可疑为 0”、“钓鱼为 -1”。
2.2 分析性能的特征/属性及其相应规则
| 特征/属性 | 规则 |
|---|
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



