T1.证明二项分布与Beta分布的关系
这里我们先给出Beta分布的形式
Beta(α,β):P(X|α,β)=xα−1(1−x)β−1B(α,β)
这里
B(α,β)=∫10tα−1(1−t)β−1dt
我们的问题为:给定X∼(n,p),找出P(X)和Beta分布的关系。
我们假设有C1,C1,....Cnn 独立同分布的随机变量,满足0,1上的均匀分布。用随机变量X表示这n个随机变量中满足Ck<p的个数,这样我们就构造出一个满足二项分布的X,
则P(X≤k)=P(C(k+1)>p) 其中Ck表示C1,C2,...Cn中第k+1大的数。
那么Ck+1是一个什么样的分布呢,我们可以知道,在这n个随机变量中,有k个数小于Ck+1,有n-k-1个数大于C_{k+1},假设我们将0-1区间分成三份[0,x),[x,x+Δx),[x+Δx,1],我们可以得到,Ck+1对应事件发生的概率为n∗(n−1k)x(k)(1−x−Δx)(n−k−1)Δx
P(x≤Ck+1≤x+Δx)=n∗(n−1k)x(k)(1−x−Δx)(n−k−1)Δx
当Δx→0时,C_{k+1}的概率密度函数为n!k!(n−k−1)!xk(1−x)(n−k−1),即Beta(x|k+1,n−k)
P(X≤k)=∫10Beta(t|k+1,n−k)dt , 其中X∼B(n,p)