文章标题:Efficient Graph Similarity Search Over Large Graph Databases2015 TKDE
文章来源: Weiguo Zheng, Lei Zou, Xiang Lian, Dong Wang, Dongyan Zhao:
Efficient Graph Similarity Search Over Large Graph Databases. IEEE Trans. Knowl. Data Eng. 27(4): 964-978 (2015)
文章摘要:
提出了3中过滤边界。相比于前人的工作,本文的边界更加紧密,使用了joint-parition和compact branch两种边界,以及这两种边界的混合过滤。同时设计了u-tree这种索引结构。但是时间原因,没有读完,只阅读了其中和compact branch先关的部分。
算法2计算了给定两个图 q q q和 g g g的branch是如何计算下界的。本来如果通过二部图匹配的方法计算下界,需要 O ( n 3 ) O(n^{3}) O(n3)的时间复杂度。为了简化时间复杂度,设计了这种启发式的方法。对于两个branch, b ( u ) b(u) b(u)和 b ( v ) b(v) b(v)不在使用如下的计算方法:
而是按照实际的branch,根据定义4.4,规定了三种情况的值:
- 如果 b ( u ) b(u) b(u)和 b ( v ) b(v) b(v)相等,则距离为0,从 B ( q ) B(q) B(q)和 B ( g ) B(g) B(g)中移除这对branch.
- 如果 b ( u ) b(u) b(u)和 b ( v ) b(v) b(v)不等,但是他们的根部标签相等,即 l u l_{u} lu和 l v l_{v} lv,则距离规定为0.5,同时从 B ( q ) B(q) B(q)和 B ( g ) B(g) B(g)中移除这对branch,共记作Y对
- 通过step1和step2之后的branches,假设 B ( q ) B(q) B(q)中有 Z Z Z个branches,那么最后总的距离为 d i s C = Y ∗ 0.5 + Z dis_{C} = Y * 0.5 + Z disC=Y∗0.5+Z
。。。。。。。。。。。。。。。。。2021.3.10更新。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
以上是研究图相似搜索问题的原因,一个很详细和直观的例子。