异构网络嵌入:RHINE模型的原理与实践
1. 异构关系的结构差异分析
为了更好地理解各种关系之间的结构差异,以DBLP网络为例。对于关系PC,节点类型P的平均度为1.0,而节点类型C的平均度为718.8,这表明论文和会议在结构上是不等价的,论文以会议为中心。而D(AP) = 1.1 表明作者和论文在结构上是兼容且对等的,这与常识相符。从语义上看,PC关系意味着“论文在会议上发表”,表示一种附属关系;而AP关系意味着“作者撰写论文”,明确描述了一种交互关系。
还可以通过稀疏性来定义一些其他的度量,以捕捉结构差异:
[S(r) = \frac{N_r}{N_{t_u} \times N_{t_v}}]
其中 (N_r) 表示遵循关系 (r) 的实例数量,(N_{t_u}) 和 (N_{t_v}) 分别表示类型为 (t_u) 和 (t_v) 的节点数量。该度量可以将关系一致地分为两类:附属关系(ARs)和交互关系(IRs)。
ARs和IRs具有明显不同的特征:
- ARs表示一种以一个为中心的结构,其中末端节点类型的平均度差异极大,意味着节点之间的附属关系。
- IRs描述对等结构,其中末端节点类型的平均度是兼容的,表明节点之间的交互关系。
2. 基本思路
通过深入的数学分析,发现异构关系通常可以分为具有不同结构特征的ARs和IRs。为了尊重它们的不同特征,需要为不同类别的关系专门设计不同但合适的模型。
对于ARs,建议使用欧几里得距离作为度量,来衡量低维空间中相连节点的接近程度。原因如下:
- ARs显示了节点之间的附属结构,这意味着通过此类关系相连的节点共享相似的属性
超级会员免费看
订阅专栏 解锁全文
367

被折叠的 条评论
为什么被折叠?



