参考:可汗学院
从二项分布推导泊松分布
二项分布: P ( X = k ) = C n k ⋅ p k ⋅ ( 1 − p ) n − k P(X=k) = C_n^k\cdot p^k\cdot (1-p)^{n-k} P(X=k)=Cnk⋅pk⋅(1−p)n−k
抛硬币
以抛硬币为例, p p p可以表示抛一次硬币,朝上的概率, P ( X = k ) P(X=k) P(X=k)表示抛 n n n次硬币后, k k k个硬币朝上的概率。
车流量估计
将抛硬币的场景转换为估计车流量的场景:在一个小时内,经过路口A的车辆数目为 k k k的概率 P ( X = k ) P(X=k) P(X=k)。车流量场景于抛硬币场景相比,加入了时间约束。如果我们现在继续用二项分布来解决该场景,需要对时间进行离散化。
- 假设一个小时平均车流量是 λ \lambda λ
- 将一个小时的观测近似为3600次一秒的观测,即 n = 3600 n=3600 n=3600
- 则一秒钟,车辆通过的概率 p = λ 3600 p=\frac{\lambda}{3600} p=3600λ (PS:此处不够严谨,稍后会介绍)
一小时内,经过路口A的车辆数目为k的概率:
P ( X = k ) = C 3600