网络安全:钓鱼检测与抗盗窃密码管理方案
一、钓鱼检测系统
1.1 系统概述
介绍了一种结合人工验证黑名单、信息检索和机器学习技术的概率性钓鱼检测框架。该框架能快速适应新攻击,具有较高的真阳性率和接近零的假阳性率。
1.2 系统原理
- 利用相似性 :利用钓鱼网页之间的高度相似性,运用搜索引擎用于网页重复检测的 shingling 技术,将给定网页与黑名单中的已知钓鱼网页进行对比,标记为相似或不相似。
- 减少误报 :使用两个合法域名白名单以及一个过滤模块(采用 TF - IDF 算法和搜索引擎查询)进一步检查潜在钓鱼网页的合法性。
1.3 实验结果
| 设置 | 真阳性率(TP) | 假阳性率(FP) |
|---|---|---|
| 无 TF - IDF 过滤 | 73.53% | 0.03% |
| 有 TF - IDF 过滤(最优设置) | 67.15% | 0% |
1.4 滑动窗口机制
- 该机制能在准确性和运行效率之间取得良好平衡。仅使用两周的训练钓鱼数据,采用面向搜索的过
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



