数据挖掘与Web数据挖掘研究进展
1. 数据挖掘与归纳数据库框架
数据挖掘的整个过程可视为一种查询活动。我们提出了归纳数据库的框架,通过对操作进行简单形式化,能将挖掘过程定义为一系列查询,这得益于其封闭性属性。虽然目前还没有具体的查询语言或查询评估策略,但这是迈向通用KDD应用查询语言的必要步骤。
一些查询语言,如M - SQL和MINERULE,分别适用于布尔和关联规则挖掘,是归纳数据库查询的不错选择。此外,还提出了一种简单的模式发现代数,支持模式生成、筛选和组合操作,允许用户指定发现策略,但未考虑实现问题和对挖掘步骤的增值支持。
标准数据库术语无需引入额外概念,就能进行归纳数据库查询,近期查询优化技术也可用于归纳数据库实现。一个重要问题是,归纳数据库框架对于合理的数据挖掘问题集合是否有吸引力,目前我们正在研究需要不同类型模式的KDD过程。
以下是一个实验各阶段的总结表格:
| 阶段 | 操作 | 查询及条件 |
| — | — | — |
| 1 | 选择 ( \sigma_{F_1}((r_0; s_0)) = (r_0; s_1) ) | ( F_1 = e(r_0):f \geq 0.005 \land e(r_0):c \geq 0.05 \land \vert LHS \vert \leq 10 ) |
| 2 | 投影 ( \pi_T((r_0; s_1)) = (r_1; s_2) ) | ( T = R \setminus {alarm text, time} ) |
| 3 | 选择 ( \sigma_{F_2}(\sigma_{C_1}((r_1; s_2))) = (r_2; s_3)
超级会员免费看
订阅专栏 解锁全文
1024

被折叠的 条评论
为什么被折叠?



