概率论知识回顾(六)
重点:常见的概率分布
知识回顾用于巩固知识和查漏补缺。知识回顾步骤:
- 查看知识回顾中的问题,尝试自己解答
- 自己解答不出来的可以查看下面的知识解答巩固知识。
- 对知识解答有疑问的,说明有关这一点的知识或者公式没有理解透彻或者没有记住,要重新翻看书籍。
知识回顾
- 什么是 (0-1)分布?
- 什么是二项分布?二项分布在那个位置取得概率最大值?
- 二项分布和 (0-1) 分布有什么关系?
- 什么是泊松分布?泊松分布在什么位置取得最大值?泊松分布通常用来描述哪一类事件?
- 什么是几何分布?它和二项分布的关系是什么?
- 怎么解释集合分布的无记忆性?
- 什么是负二项分布/帕斯卡分布?
- 什么是超几何分布?
知识解答
- 什么是 (0-1)分布?
- P{X=k}=pk(1−p)1−k,k=0,1P\begin{Bmatrix} X = k \end{Bmatrix} = p^k(1-p)^{1-k} , k=0,1P{X=k}=pk(1−p)1−k,k=0,1
- (0-1) 其实就是之前提到的一重伯努利分布,它只有两个基本事件,概率分别是p和1-p。
- 例如在某个实验中我们只关心事件 A 是否会出现,就可以使用 (0-1) 分布来进行表示。即 X={1,ω∈A0,ω∉AX = \begin{cases} 1, \omega \in A \\ 0, \omega \notin A \end{cases}X={1,ω∈A0,ω∈/A
- 什么是二项分布?二项分布在那个位置取得概率最大值?
- P{X=k}=Cnkpk(1−p)n−k,k=0,1,2,...,nP\begin{Bmatrix} X = k \end{Bmatrix} = C_n^kp^k(1-p)^{n-k} , k = 0,1,2,...,nP{X=k}=Cnkpk(1−p)n−k,k=0,1,2,...,n 记作 : X∼B(n,p)X \sim B(n,p)X∼B(n,p)
- 二项分布就是之前提到的多重伯努利分布,他表示多次(n)实验中事件 A 出现的次数(k)的概率。
- 由于 P{X=k}P{X=k−1}=1+(n+1)p−kk(1−p)\frac{P\begin{Bmatrix} X = k \end{Bmatrix}}{P\begin{Bmatrix} X = k-1 \end{Bmatrix}} = 1+ \frac{(n+1)p-k}{k(1-p)}P{X=k−1}P{X=k}=1+k(1−p)(n+1)p−k 因此可以知道
- k<(n+1)pk < (n+1)pk<(n+1)p 单调递增
- k>(n+1)pk > (n + 1)pk>(n+1)p 单调递减
- 我们知道k是整数, 因此,如果 (n+1)p∈Z∗(n+1)p \in Z^*(n+1)p∈Z∗ 在 (n+1)p和(n+1)p−1(n+1)p 和 (n+1)p - 1(n+1)p和(n+1)p−1取得最大值。
- 二项分布和 (0-1) 分布有什么关系?
- 二项分布可以看做是多次 (0-1) 分布组合的结果。如果把实验中的第 i 次试验看做事件 A 是否会出现。那么第 i 次试验就是一个 (0-1)分布,二项分布就是将这个试验重复进行 n 次。而且这些试验都是相互独立的。即: X=X1+X2+⋯+XnX = X_1 + X_2 + \dots + X_nX=X1+X2+⋯+Xn
- 什么是泊松分布?泊松分布在什么位置取得最大值?泊松分布通常用来描述哪一类事件?
- P{X=k}=λke−λk!,k=0,1,2,...P\begin{Bmatrix} X=k \end{Bmatrix} = \frac{\lambda^ke^{-\lambda}}{k!} , k = 0,1,2,...P{X=k}=k!λke−λ,k=0,1,2,...
- 取得最大值:{k=λ或λ−1λ是整数k=[λ]λ不是整数\begin{cases} k=\lambda或\lambda-1 & \lambda 是整数 \\ k = [\lambda] & \lambda 不是整数 \end{cases}{k=λ或λ−1k=[λ]λ是整数λ不是整数
- 泊松分布用来描述那些发生概率非常小的事件大量重复试验的出现次数的试验。由于二项分布对于这类事件计算比较麻烦,同时泊松分布和二项分布有类似性,都是先增后减,所以常用泊松分布代替二项分布。
- 什么是几何分布?
- P{X=k}=p(1−p)k−1,k=1,2,...P\begin{Bmatrix} X = k\end{Bmatrix} = p(1-p)^{k-1}, k = 1,2,...P{X=k}=p(1−p)k−1,k=1,2,...
- 几何分布表示事件A出现立即停止试验,问第k次试验停止试验的概率。
- 怎么解释几何分布的无记忆性?
- 根据公式有 P{X=n+m∣X>n}=P{X=m}P\begin{Bmatrix}X = n + m | X>n\end{Bmatrix} = P\begin{Bmatrix}X = m\end{Bmatrix}P{X=n+m∣X>n}=P{X=m} 可知
- 在已经进行n次试验的情况下,进行n+m结束试验的概率和进行m次试验结束试验的概率是一样的。
- 也就是说无论之前有没有进行试验,或者在哪一个位置开始进行试验,进行m次结束试验的概率都是相等的。
- 也就是说在几何分布中试验不受之前的试验影响。
- 根据公式有 P{X=n+m∣X>n}=P{X=m}P\begin{Bmatrix}X = n + m | X>n\end{Bmatrix} = P\begin{Bmatrix}X = m\end{Bmatrix}P{X=n+m∣X>n}=P{X=m} 可知
- 什么是负二项分布/帕斯卡分布?
- P{X=k}=Ck−1r−1pr(1−p)k−r,k=r,r+1,r+2,...P\begin{Bmatrix}X=k\end{Bmatrix} = C_{k-1}^{r-1}p^r(1-p)^{k-r} , k = r, r+1, r+2, ...P{X=k}=Ck−1r−1pr(1−p)k−r,k=r,r+1,r+2,...
- 表示 在实验中事件 A 恰好出现 r 次时,试验进行k次的概率。因此 k≥rk \ge rk≥r
- 对于 Ck−1r−1C_{k-1}^{r-1}Ck−1r−1 因为事件A恰好要出现r次,因此在最后一次试验是必然是A事件要出现,因此在排列组合的时候不必考虑最后一次试验。但是在算概率的时候是需要的。
- 当 r = 1 时, 负二项分布就是几何分布。
- 什么是超几何分布?
- P{X=k}=CMkCN−Mn−kCNn,k=0,1,2,...,min(M,n)P\begin{Bmatrix} X = k \end{Bmatrix} = \frac{C_M^kC_{N-M}^{n-k}}{C_N^n} , k = 0,1, 2,...,\min(M, n)P{X=k}=CNnCMkCN−Mn−k,k=0,1,2,...,min(M,n)
- 表示在N个产品中有M个次品,从中取n个产品,次品有k个的概率是多少。
- 超几何分布属于不放回抽样,如果放回的话,那么其实就是二项分布,因为是否出现次品就可以看做为事件A。每次试验的概率都是相同的。
- 可以看到上面,除了超几何分布以及泊松分布以外的几个分布都是基于伯努利分布进行变形或扩展得来的,它们都基于一个最基本的要求,即单次试验只会出现两个基本事件 A和A‾A 和 \overline AA和A,它们的概率分别为 p 和 1-p。