基于机器学习的恶意网页链接检测的基数相关过采样方法
1. 引言
检测钓鱼网站的性能可以通过不同的机器学习策略来实现。机器学习技术在检测恶意网页方面,在大型数据库资源上能取得很好的效果。系统中的参与者在系统运行时,可以通过动态检测恶意网页的存在来保障安全。有一种技术可用于开发反钓鱼 URL 软件,通过向用户发出可能存在安全问题的警告。
2. 文献综述
过去有很多学者采用不同的方法进行恶意网页和钓鱼网站的检测,下面是一些常见的方法:
- 分类器评估与比较 :评估了许多监督批量学习分类器,通过实验比较各种分类器,以确定在识别钓鱼问题中表现最佳的分类器。
- 多层认证检测 :基于特征向量进行多层认证,以检测钓鱼网站,并通过文本、视觉相似性和基于特征的检测方法进行预防,目的是准确预测页面是钓鱼还是合法的。
- 恶意网页检测技术调查 :对不同的恶意网页检测技术进行了调查,以在恶意网页检测中获得最高的准确性,这需要训练大量数据集。
- 基于 URL 语义的分类 :提出了一种分类方法,不仅考虑 URL 的语法性质,还考虑其同义词含义,使用随机森林模型等监督机器学习概念,发现卷积神经网络(CNN)在特定特征集的分类模型构建中取得了最佳结果。
- 基于 URL 行为和属性的检测 :提出了一种基于 URL 行为和属性的恶意 URL 检测方法。
- 对抗概念漂移的检测 :提出了一种检测和对抗手动诱导概念漂移的范例,通
超级会员免费看
订阅专栏 解锁全文
3641

被折叠的 条评论
为什么被折叠?



