利用词汇相似度提取局部网络社区
在网络信息的海洋中,如何准确地提取局部网络社区是一个重要的研究课题。本文将介绍相关的工作、方法以及实验结果,旨在解决现有算法存在的问题,提高网络社区提取的质量和效率。
相关工作
- 最大流算法
- 设 (G = {V, E}) 为有向图,其中 (V) 是节点集,(E) 是边集。对于边 ((u, v) \in E),有分配的容量 (c(u, v) \in Z^+)。固定节点 (s, t \in V),从 (s) 到 (t) 的流 (f) 是一个非负整数函数,满足 (0 \leq f(u, v) \leq c(u, v)) 对于所有 ((u, v) \in E),且对于所有 (v \in V - {s, t}),(\sum_{(u_i, v) \in E} f(u_i, v) = \sum_{(v, u_j) \in E} f(v, u_j)),即从 (s) 流出的总流量等于流入 (t) 的总流量,图的最大流算法用于找到图的最大流。
- 设 (S \subseteq V),(T = V / S),且 (s \in S),(t \in T),边集 ({(u, v) \in E | u \in S, v \in T}) 称为图 (G) 上的 (s - t) 割,最小割是使割边总容量最小的割。著名的最大流 - 最小割定理证明了最大图流等于最小割的值。
- 基于最大流算法的社区提取
- Flake 等人将网络社区定义为一组网站,这些网站与社区成员之间的链接(无论方向)比