随机图游走与马尔可夫链的深入解析
1. 负二项分布拟合数据
在分析数据时,负二项分布是一种常用的概率分布。对于随机变量 (X \sim NegBin(r, p)),其前两个理论矩分别为:
- 一阶矩:(E[X] = \frac{r(1 - p)}{p})
- 二阶矩:(E[X^2] = V[X] + E[X]^2 = \frac{r(1 - p)}{p^2} + (\frac{r(1 - p)}{p})^2)
给定一组数据,其样本一阶矩和二阶矩分别为:
- 样本一阶矩:(\frac{1}{18} \sum_{i = 1}^{18} X_i = 10.611)
- 样本二阶矩:(\frac{1}{18} \sum_{i = 1}^{18} X_i^2 = 186.833)
通过矩估计法建立方程组:
- (\frac{r(1 - p)}{p} = 10.611)
- (\frac{r(1 - p)}{p^2} + (\frac{r(1 - p)}{p})^2 = 186.833)
将第一个方程代入第二个方程,可解得 (p = 0.143),再回代求得 (r = 1.77)。这表明数据可以用参数 (r = 1.77) 和 (p = 0.143) 的负二项分布来拟合。该理论分布的图像中,(x = 27) 处的垂直线标记了分布的第 95 百分位数,将分布的底部 95% 面积与顶部 5% 面积分开。在质量控制中,工程师可以利用这个模型为未来样本的细菌计数设置上限,细菌计数超过每毫升 27 个可能是净化系统运行不正常的警告信号。