基于网络日志数据分类的性能评估与飞行自组网路由协议研究
1. 网络日志数据分类性能评估
在网络数据处理中,对网站用户的访问预测和数据挖掘是重要的研究方向。通过预测用户访问网页的情况,构建了最大堆树来处理网站结构,并使用 Java 实现算法得出实验结果。推荐算法能够根据用户当前访问和过去的导航模式为用户推荐网页。
1.1 数据挖掘应用
有一种名为 Web miner 的数据挖掘应用,在远程教育中对教师教学很有帮助。它能维护学生的个人资料和进度报告,并且让学生无需具备数据挖掘知识就能使用 Web 挖掘。该工具基于 Web 服务使用 KDD 过程,还能被外部软件使用。
1.2 研究方法
- 预处理 :数据来源于服务器日志文件,包含用户的操作信息。为提高数据质量和有效性,进行了数据预处理。具体步骤如下:
- 清理并去除图形和多媒体内容。
- 识别用户会话(用户花费的总时间)。
- 进行路径补全,查找日志文件中丢失的页面引用。此步骤有助于从 Web 服务器日志文件中识别网络攻击和网络犯罪。
- 模式发现 :使用 WEKA 这个 Web 使用挖掘工具的分类选项卡处理数据。将分类技术应用于包含从 Google Analytics 访问的服务器日志文件内容的现有数据集,并在 WEKA 工具下的不同分类算法上执行该数据集。在分类数据集的过程中,使用了不同的分类算法,如朴素贝叶斯、Lazy IBK、决策树(J48)、函数多层感知器和随机森林,并分
超级会员免费看
订阅专栏 解锁全文
1804

被折叠的 条评论
为什么被折叠?



