网络支持与云存储技术解析
1. 幂律网络度的估计
在网络研究中,估计幂律网络的度分布是一个重要问题。对于具有 $P$ 个顶点且 $k_{min} = 1$ 的离散幂律分布网络,$\gamma$ 的一个良好近似公式为:
$\hat{\gamma} \approx 1 + P \left(\sum_{i = 1}^{P} \ln \frac{k_i}{k_{min}} - \frac{1}{2}\right)^{-1} = 1 + \frac{P}{\sum_{i = 1}^{P} 2k_i}$
同时,对于离散随机变量的两个概率密度函数的相似性和差异性,有多种度量方法,如迹距离(也称为 Kolmogorov 或 $L_1$ 距离)和保真度。
1.1 迹距离和保真度的定义
- 迹距离:$D(p_X(x), p_Y(x)) = \frac{1}{2} \sum_{x} |p_X(x) - p_Y(x)|$
- 保真度:$F(p_X(x), p_Y(x)) = \sum_{x} \sqrt{p_X(x)p_Y(x)}$
迹距离是一种度量,它满足非负性、对称性、不可区分者的同一性和三角不等式。而保真度不是一种度量,因为它不满足不可区分者的同一性,即 $F(p_X(x), p_X(x)) = \sum_{x} \sqrt{p_X(x)p_X(x)} = 1 \neq 0$。
确定基于公式计算的分布与算法产生的分布之间的 $L_1$ 距离,需要所有顶点的度信息。从相关数据可知,度为 1 的顶点在幂律网络的顶点中占比很大,可对实际度分布提供合理近似。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



