XML 关键词搜索与图对象半监督聚类的高效方法
一、XML 关键词搜索中的 TDPrune 与 MaxMatch 系统
在 XML 关键词搜索领域,为了更高效地识别贡献节点,TDPrune 系统和 MaxMatch 系统应运而生。
-
节点分类
- 节点分类基于节点序列(L16),L18 - L22 的 for 循环执行与 MaxMatch 相同的测试。若子节点被识别为贡献者,将递归调用 PruneMatch 算法处理其后代节点(L23 - L25)。
- 所有匹配节点及其祖先节点构成集合 V,V 中的节点可分为以下三类:
- vc :节点本身和其父节点都是贡献者。
- vpc :节点本身不是贡献者,但父节点是贡献者。
- vpnc :节点的父节点不是贡献者。
- 以查询 Q2 为例,其节点分类如图 9 所示,vc、vpc 和 vpnc 分别用实心圆、空心圆和叉号表示。例如,节点 1.2 是 vc,因为它和其父节点 1 都是贡献者;节点 1.3 是 vpc,这也使得节点 1.3.2 成为 vpnc。
-
PruneMatch 模块对比
- MaxMatch 的 PruneMatch 模块分两步:首
XML关键词搜索与图聚类方法
超级会员免费看
订阅专栏 解锁全文
72

被折叠的 条评论
为什么被折叠?



