分类法间概率映射的发现与实验分析
1. 概率映射的发现过程
1.1 候选映射生成
给定两个分类法 $T_i$ 和 $T_j$ 及其关联实例,设 $M(T_i, T_j)$ 是从 $T_i$ 到 $T_j$ 的所有映射的集合(形式为 $C_i \subseteq D_j$)。ProbaMap 算法的原理是根据拓扑排序生成两个分类法中类的映射。具体来说,它通过按逆拓扑顺序枚举 $T_i$ 的类 $C_i$ 和按直接拓扑顺序枚举 $T_j$ 的类 $D_j$ 来生成所有映射 $C_i \subseteq D_j$。
命题 3 保证了映射按照逻辑蕴含的顺序生成,即如果 $m’$ 是 $m$ 的蕴含项($m’ \preceq m$),那么在逆拓扑排序中 $C_i$ 在 $C’_i$ 之前,或者 $C_i = C’_i$ 且在拓扑排序中 $D_j$ 在 $D’_j$ 之前。
1.2 候选映射的剪枝
基于概率函数 $P_i$ 的单调性(定理 1),如果 $P_i(m) < S_u$,则 $m$ 的所有蕴含项 $m’$ 都满足 $P_i(m’) < S_u$。因此,在 ProbaMap 中,对于所有 $P_i(m) < S_u$ 的映射 $m$,我们会剪去其所有蕴含项的概率估计。同样,基于概率函数 $P_c$ 的弱单调性,当 $P_c(m) < S_c$ 时,我们会剪去与 $m$ 具有相同左侧类的所有蕴含项的概率估计。
1.3 ProbaMap 算法
ProbaMap 算法的具体实现如下:
Al
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



