因果规则分析与大规模数据库关联规则挖掘
1. 因果规则分析
在因果规则分析中,我们关注的是如何通过拟合来近似因果关系。以算法 PFCPI 为例,它的目的是为给定的数据集生成一个多项式函数 F(x)。该算法的步骤如下:
1. 初始化:步骤 (1) 和 (2) 对算法进行初始化。
2. 数据预处理:步骤 (3) 对给定的数据进行预处理。
3. 数据编码:步骤 (4) 对数据进行编码。
4. 条件检查:步骤 (5) 检查条件 2N + 1 ≥ m。
5. 函数计算:步骤 (6) 计算第 N 个函数。
6. 条件检查:步骤 (7) 检查条件 |GG[N + 1, j]| > δ。
7. 结果输出:步骤 (8) 输出结果 F(x)。
下面通过两个例子来展示近似函数的效率。
例 1:简单概率表数据拟合
考虑一个简单的概率表,其中只有一个随机变量 A,其取值集合 R(A) = {red, green, yellow, blue, purple},对应的概率分别为:
| A 的取值 | 概率 |
| — | — |
| red | 0.02 |
| green | 0.50 |
| yellow | 0.00 |
| blue | 0.37 |
| purple | 0.11 |
对数据进行编码后得到:
| EA | 1 | 2 | 3 | 4 | 5 |
| — | — | — | — | — | — |
| EP(A) | 0 | 6 | 16 | 30 | 48 |
超级会员免费看
订阅专栏 解锁全文
1564

被折叠的 条评论
为什么被折叠?



