大型属性图中的在线偏好最近邻浏览
1. 引言
随着互联网和万维网的快速发展,高效搜索满足用户偏好的最近邻(NN)的技术受到了越来越多的关注。本文研究了一种新的最近邻搜索问题,即偏好最近邻浏览。以下是一些实际应用场景:
- 旅游场景 :在大型道路网络中,游客计划访问几个地方时,希望找到具有特定特征(如提供网络和游泳池)的附近酒店,并了解酒店与这些地方之间的确切距离。
- 餐饮场景 :用户给出酒店名称,搜索附近具有某些特征的餐厅,希望先返回离餐厅最近且符合要求的酒店。
- 科研合作场景 :研究人员对新主题感兴趣,在合作网络中搜索研究该主题且与自己朋友距离较近的作者,潜在合作者可以按与朋友的距离排序。
基于这些需求和应用,本文定义了偏好最近邻浏览问题。设 $G = (V, E)$ 是一个边加权有向图,$V$ 是节点集,$E$ 是边集,每条边的权重为非负数。节点 $u$ 到节点 $v$ 的最短距离 $\delta(u, v)$ 是从 $u$ 到 $v$ 的路径上的最小总权重。节点与属性相关联以描述其特征,用户提供一个或多个源节点 ${q}$ 和多个关键字 ${t}$,返回一个节点对列表,其中一个节点来自 ${q}$,另一个节点 $v$ 包含所有所需的 ${t}$,列表按 $q$ 和 $v$ 之间的距离排序。
这种查询还可以作为新兴的基于图距离的应用的构建块,如基于图结构的 XML 数据、生物图和关键字搜索。
2. 问题陈述
偏好最近邻浏览问题基于一个大型属性图 $G(V, E)$,每个节点有一个或多个关