前言
二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决.在实际应用中,理解并区分两个概率模型是至关重要的.下面举例进行对比辨析.
概念辨析
- 超几何分布
一般的,在含有 M M M件次品的 N N N件产品中,任取 n n n件,其中恰有 X X X件次品,则事件 { X = k } \{X=k\} { X=k}发生的概率为 P ( X = k ) = C M k ⋅ C N − M n − k C N n P(X=k)=\cfrac{C_M^k\cdot C_{N-M}^{n-k}}{C_N^n} P(X=k)=CNnCMk⋅CN−Mn−k,( k = 0 , 1 , 2 , ⋯ , m k=0,1,2,\cdots,m k=0,1,2,⋯,m),其中 m = m i n { M , n } m=min\{M,n\} m=min{ M,n},且 n ≤ N n\leq N n≤N, M ≤ N M\leq N M≤N, n n n, M M M, N ∈ N ∗ N\in N^* N∈N∗,称这样的分布列为超几何分布列,如果随机变量 X X X的分布列具有下表的形式,则称随机变量 X X X服从超几何分布。
X X X | 0 0 0 | 1 1 1 | 2 2 2 | ⋯ \cdots ⋯ | m m m |
---|---|---|---|---|---|
P P P | C M 0 C N − M n − 0 C N n \cfrac{C_M^0C_{N-M}^{n-0}}{C_N^n} CNnCM0CN−Mn−0 | C M 1 C N − M n − 1 C N n \cfrac{C_M^1C_{N-M}^{n-1}}{C_N^n} CNnCM1CN−Mn−1 | C M 2 C N − M n − 2 C N n \cfrac{C_M^2C_{N-M}^{n-2}}{C_N^n} CNnCM2CN−Mn−2 | ⋯ \quad\cdots\quad ⋯ | C M m C N − M n − m C N n \cfrac{C_M^mC_{N-M}^{n-m}}{C_N^n} CNnCMmCN−Mn−m |
如果 X X X服从参数为 n n n, M M M, N N N的超几何分布,记作 X ∼ H ( n , M , N ) X\sim H(n,M,N) X∼H(n,M,N),其数学期望 E ( X ) = n M N E(X)=\cfrac{nM}{N} E(X)=NnM。
- 二项分布
一般的,在 n n n次独立重复试验中,设事件 A A A发生的次数为 X X X,每次试验中事件 A A A发生的概率为 p p p,则事件 A A A恰好发生 k k k次的概率为 P ( X = k ) = C n k ⋅ p k ⋅ ( 1 − p ) n − k P(X=k)=C_n^k\cdot p^k\cdot (1-p)^{n-k} P(X=k)=Cnk⋅pk⋅(1−p)n−k,( k = 0 , 1 , 2 , ⋯ , n k=0,1,2,\cdots,n k=0,1,2,⋯,n),此时称随机变量 X X X服从二项分布,记为 X ∼ B ( n , p ) X\sim B(n,p) X∼B(n,p),并称 p p p为成功概率,称 1 − p 1-p 1−p为失败概率,当然成功和失败只是抽象的说法。
解释:二项展开式 [ p + ( 1 − p ) ] n = 1 n = 1 [p+(1-p)]^n=1^n=1 [p+(1−p)]n=1n=1中,事件 A A A发生 k k k次,即对应展开式中的含 p k p^k pk的项,其为 C n k ⋅ p k ⋅ C n − k n − k ⋅ ( 1 − p ) n − k C_n^k\cdot p^k\cdot C_{n-k}^{n-k}\cdot (1-p)^{n-k} Cnk⋅pk⋅Cn−kn−k⋅(1−p)n−k,即 P ( X = k ) = C n k ⋅ p k ⋅ ( 1 − p ) n − k P(X=k)=C_n^k\cdot p^k\cdot (1-p)^{n-k} P(X=k)=Cnk⋅pk⋅(1−p)n−k,
若随机变量 X X X服从二项分布,记为 X ∼ B ( n , p ) X\sim B(n,p) X∼B(n,p),则 E ( X ) = n p E(X)=np E(X)=np, D ( X ) = n p ( 1 − p ) D(X)=np(1-p) D(X)=np(1−p);
案例剖析
袋中有