归纳逻辑编程与关系数据挖掘入门
1. 引言
在知识发现领域,归纳逻辑编程(ILP)专注于开发关系数据挖掘(RDM)的技术和工具。传统数据挖掘方法通常在单个表中寻找模式,而关系数据挖掘则能在关系数据库的多个表中发现模式。ILP工具可直接处理多关系数据,避免了通过连接或聚合将多表数据集成到单表时可能导致的信息丢失。
例如,有客户关系表 customer(CustID, Name, Age, SpendsALot) 和购买关系表 purchase(CustID, ProductID, Date, Value, PaymentMode) ,若想找出消费多的客户,直接连接两个表会使结果对应购买记录而非客户,聚合操作也会丢失部分信息。而ILP系统可以发现如下模式:
customer(CID, Name, Age, yes) ←
Age > 30 ∧
purchase(CID, PID, D, Value, PM) ∧
PM = credit card ∧ Value > 100.
该模式表明:“年龄超过30岁、购买价值超过100且使用信用卡支付的客户消费较多”。
ILP系统不仅能直接处理多表数据,还能以逻辑程序的形式考虑通用的背景(领域)知识,并且使用逻辑程序语言描述发现的模式。单表数据挖掘方法被称为属性值或命题学习方法,其发现的模式可用命题逻辑表达;而ILP方法也被称为一阶学习方法或关系学习方法,其模式用一阶逻辑的关系形式表达。
超级会员免费看
订阅专栏 解锁全文
28

被折叠的 条评论
为什么被折叠?



