数据挖掘(数据库中的知识发现):从数量众多、信息模糊、知识随机的实际数据中,提起其中用户感兴趣或有用的信息和知识的过程。
数据挖掘主要包括:
1.数据:各种文本、web页面、多媒体信息
2.模式:通过分析、推理等方法对数据进行“挖掘”,得出其中蕴含的规则和规律以及论断,称为模式,它具有未知的,潜在有用的以及规则简单等特点。
3.数据处理过程:数据挖掘是一个复杂的数据处理过程,其中大部分的工作有系统来而非人工干预完成,但其中仍有一少部分需要人工干预,以提高数据挖掘的有效性和有用性。
web数据挖掘:在web环境下应用的数据挖掘技术。是指从网络中海量的web文档集合中发现那些用户感兴趣的、隐含的、潜在的有用信息的发现模式。通过对这些数据的挖掘与发现,人们可以更好的利用网络资源,达到数据共享和分析处理。
一般的数据挖掘:指从大型数据库中提取人们感兴趣的知识,它的主要侧重点在已有信息中提取有规律性的知识。
web的数据挖掘的主要研究对象

数据挖掘是从大量数据中提取有价值知识的过程,涉及数据、模式和处理过程。主要类型包括web数据挖掘,分为内容挖掘、结构挖掘和用户使用记录挖掘。关键任务包括分类预测、关联分析、聚类分析、概念描述和偏差检测。常用技术涵盖统计分析、聚类、粗糙集、遗传算法、决策树、神经网络和可视化。
最低0.47元/天 解锁文章
5283

被折叠的 条评论
为什么被折叠?



