社交网络图挖掘3--重叠社区的发现及Simrank

本文介绍了社交网络图挖掘中的重叠社区发现,使用极大似然估计来处理社区成员的隶属关系,并探讨了社区-关系图模型。接着,文章详细阐述了Simrank算法,一种用于计算节点相似度的方法,特别是在带重启的随机游走框架下,以评估节点间的相识度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

重叠社区的发现

相关知识点

社区的本质:一个实体有可能同时属于两个社区,任一社区内的边会十分密集,但是两个社区交集内的边会更加密集,而三个社区交集内的边还要密集。

极大似然估计(maximum likelihood estimation,MLE):我们对某种对象(如朋友图)实例的生成过程(即模型)建立某种假设。模型的参数确定了任一具体实例的生成概率,该概率称为这些参数值的似然(likelihood)。

关系图模型

社区-关系图(community-affiliation graph)
社区-关系图(community-affiliation graph)机制可以从社区生成社交网络图,规定如下:

  1. 存在给定数目的社区,存在给定数目的个体(图的节点);
  2. 每个社区可以拥有任意的个体集合作为成员,即个体对社区的隶属关系是模型的参数;
  3. 每个社区C都有一个概率 Pc 与之相关联,该概率表示C中两个成员由于都是C中成员而通过边连接的概率,这些概率也是模型参数;
  4. 如果一对节点属于两个或更多社区,那么如果某个包含这两个节点的社区按照规则3判定节点间有边的话,那它们之间就有边。

计算通过上述机制生成图的概率,计算的关键点:

  1. 给定个体到社区的分配
  2. Pc 值;
  3. 如何计算边的概率。如果 u v 是社区的非空集合M中每个社区的成员,并且不是其他社区的成员,那么 u v 之间存在边的概率为:
    Puv=1CinM(1Pc)

那么E等于观察图中边集合的似然为:

(u,v)inEPuv(u,v)notinE(1Puv
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值