多关系数据库分类方法解析
1. 引言
传统的数据挖掘方法多基于单一关系,采用命题学习法或属性 - 值学习法,运用命题逻辑来表示知识和模型。而多关系数据挖掘(MRDM)则是一个多学科领域,它从关系数据库的多个关系表中提取模式。其利用归纳逻辑编程(ILP)、KDD、机器学习和关系数据库等技术,致力于直接从多关系数据集中发现新知识。与基于单一关系的挖掘方法不同,MRDM 直接对多关系数据进行挖掘,避免了预处理过程的复杂性和因压缩导致的信息丢失问题。
多数据库挖掘可分为三个步骤:
1. 对多数据库进行分类。
2. 挖掘每个数据库。
3. 对同一数据库挖掘得到的知识进行综合。
其中,第一步就是数据挖掘分类。分类是数据挖掘中常用的方法,其目的是为事件或目标进行分类。分类模型既可以用于现有数据,也可以用于预测未来数据。分类的目标是建立一个分类函数或分类模型(分类器),将数据库中的数据条目映射到给定的类别中。分类可用于预测,通过历史记录自动推导数据的特征描述,从而预测未来数据。
2. 多关系数据库分类研究现状
近年来,数据挖掘领域出现了许多分类算法,如决策树、关联规则、贝叶斯、神经网络、规则学习、k - 近邻、遗传算法、粗糙集和模糊逻辑技术等。然而,这些分类方法在关系数据库领域的应用研究仍然较少。
3. 多关系数据库分类方法
3.1 多关系决策树分类
决策树是一种类似于流程图的树结构,其中每个内部节点表示对一个属性的测试,每个分支表示测试输出,每个叶节点表示一个类别。在 CART 方法的基础上,为克服其语言局限性,引入了 S - CART 分类树到统计关系
超级会员免费看
订阅专栏 解锁全文
1408

被折叠的 条评论
为什么被折叠?



