基于数据挖掘的网络入侵检测与邮件垃圾过滤技术解析
1. 网络入侵检测系统中的数据挖掘方法
在网络入侵检测系统中,数据挖掘发挥着至关重要的作用,以下为您详细介绍几种常见的数据挖掘方法。
- 关联规则生成 :从频繁项集中生成关联规则,利用用户给定的最小置信度(min_con),从每个最大频繁项集中发现置信度不低于 min_con 的关联规则。
- 数据分类分析方法 :这是数据挖掘中应用最为频繁的方法。分类旨在为数据找到类别概念描述,代表该类别数据的整体信息,通常以规则或决策树的形式呈现。类别内涵描述包含特征描述和区别描述,前者描述类别对象的共同特征,后者描述类别间的差异。系统中的分类分析任务是分析安全事件数据库中的安全事件,准确描述所有事件的类别并推导事件分类规则。常见的分类算法有 CART、ID3 和 C45。数据分类的具体步骤如下:
1. 获取训练数据集,数据集中的数据记录与目标数据库的数据记录具有相同的数据项。
2. 在训练数据集中,每个数据记录都有已知的类型标识用于关联。
3. 分析训练数据集,提取其数据记录的特征属性,并为每种类型推导准确的描述模型。
4. 使用推导的类型描述模型对目标数据库中的数据记录进行分类,或推导优化的分类模型(分类规则)。
- 聚类分析方法 :数据聚类是将物理或抽象对象分类为若干组。组内对象相似度高,组间对象相似度低。聚类分析的输入集是一组未标记、未分类的记录。它能合理划分记录集,并以隐式或显式方法描述不同等级。聚类分析可分析一组未分类的安全事件,根据分类分析的预定分类规则,将大量分散的安全事件归类为描述入侵
超级会员免费看
订阅专栏 解锁全文
776

被折叠的 条评论
为什么被折叠?



