大规模不确定图上的Top-K可能最短路径查询与网页上的命名实体识别器训练
1. 大规模不确定图上的Top-K可能最短路径查询
在大规模不确定图中进行Top-K可能最短路径查询是一个重要的研究方向。对于估计精度,有如下方程:
[Pr(p \in [p - \varepsilon, p + \varepsilon]) > 1 - \delta]
根据估计概率 (Pr(\sum_{i = n - 1}^{i = 1}E(P_i - P_n))),对于每个候选路径 (P_n),可以通过方程5轻松计算 (Pr(P_n = SP(G))),随后将Top-K可能最短路径报告给用户。
1.1 实验设置
在实验中,使用了真实和合成的数据集。由于目前没有关于Top-K可能最短路径查询的现有工作,为了便于比较,将Top-K可能最短路径查询转换为基于阈值的查询,采用递减阈值的方法,简称为“递减阈值法(DT)”。具体操作步骤如下:
1. 首先将阈值 (\theta) 设置为一个较大的值。
2. 根据相关算法,如果能找到Top-K可能最短路径,则报告结果并终止算法。
3. 否则,减小 (\theta) 并重复上述过程,直到获得Top-K答案。
所有实验均使用标准C++实现,在运行Windows XP的P4 1.7G、1G RAM的机器上进行。
1.2 数据集
使用了两个大型真实数据集:
1. Yago :从维基百科中提取事实,并与WordNet词库集成。构建的大型不确定图中,每个顶点表示一个实体,每条边表示两个实体之间的属性,边权重设为‘
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



