63、大数据时代的链接与图挖掘:从加权网络到多层网络

大数据时代的链接与图挖掘:从加权网络到多层网络

在大数据时代,图和网络在众多系统和应用中具有重要地位。图计算框架如 Apache TinkerPop 及其支持的 Gremlin 遍历语言,为处理图数据库和图分析引擎的查询提供了有力工具。接下来,我们将深入探讨加权网络和多层网络的相关内容。

加权网络

单网络通常将连接表示为二元实体,即边要么存在,要么不存在,边本身提供的信息有限。然而,节点之间的链接可能具有描述性属性,如强度、容量、持续时间、亲密度或服务交换等,这些属性可以编码为链接的权重。

在过去十年里,对加权网络的研究并不深入。加权网络可以被视为一种多层网络,其中权重表示两个节点之间的边的数量。网络边的权重有助于建模和定义弱连接与强连接。节点的强度($S_{v_i}$)是衡量这种连接的一种方式,其定义为节点$v_i$所有邻居的权重之和:
$S_{v_i} = \sum_{v_j \in V(v_i)} w_{v_i,v_j}$

有研究提出了 OddBall 方法,用于在加权图中快速检测异常节点,并表明图的总权重$W_{v_i}$和边的数量$E_{v_i}$遵循幂律概率分布。在移动电话通话的互惠性研究中,也发现了一些有趣的权重模式。在链接预测方面,使用加权网络的模型通常比使用多层网络框架的模型更简单,因为权重有助于提高算法预测新边的准确性。

下面通过一个简单的表格来对比单网络和加权网络的特点:
| 网络类型 | 连接表示 | 边信息 | 模型特点 |
| ---- | ---- | ---- | ---- |
| 单网络 | 二元实体 | 仅存在与否 | 简单但信息有限 |
| 加权网络 |

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值