大数据时代的链接与图挖掘:从加权网络到多层网络
在大数据时代,图和网络在众多系统和应用中具有重要地位。图计算框架如 Apache TinkerPop 及其支持的 Gremlin 遍历语言,为处理图数据库和图分析引擎的查询提供了有力工具。接下来,我们将深入探讨加权网络和多层网络的相关内容。
加权网络
单网络通常将连接表示为二元实体,即边要么存在,要么不存在,边本身提供的信息有限。然而,节点之间的链接可能具有描述性属性,如强度、容量、持续时间、亲密度或服务交换等,这些属性可以编码为链接的权重。
在过去十年里,对加权网络的研究并不深入。加权网络可以被视为一种多层网络,其中权重表示两个节点之间的边的数量。网络边的权重有助于建模和定义弱连接与强连接。节点的强度($S_{v_i}$)是衡量这种连接的一种方式,其定义为节点$v_i$所有邻居的权重之和:
$S_{v_i} = \sum_{v_j \in V(v_i)} w_{v_i,v_j}$
有研究提出了 OddBall 方法,用于在加权图中快速检测异常节点,并表明图的总权重$W_{v_i}$和边的数量$E_{v_i}$遵循幂律概率分布。在移动电话通话的互惠性研究中,也发现了一些有趣的权重模式。在链接预测方面,使用加权网络的模型通常比使用多层网络框架的模型更简单,因为权重有助于提高算法预测新边的准确性。
下面通过一个简单的表格来对比单网络和加权网络的特点:
| 网络类型 | 连接表示 | 边信息 | 模型特点 |
| ---- | ---- | ---- | ---- |
| 单网络 | 二元实体 | 仅存在与否 | 简单但信息有限 |
| 加权网络 |
超级会员免费看
订阅专栏 解锁全文
1335

被折叠的 条评论
为什么被折叠?



