1、计数原理
从 n 个不同元素取出 m(m≤n) 个元素,按照一定的顺序排成一列,叫做从 n 个不同元素中取出 m 个元素的一个排列(arrangement).
从 n 个不同元素中取出 m(m≤n) 个元素的所有不同排列的个数叫做从 n 个不同元素中取出 m 个元素的排列数,用符号 AnmA_n^mAnm 表示.
Anm=n(n−1)(n−2)...(n−m+1)=n!(n−m)!A_n^m=n(n-1)(n-2)...(n-m+1)=\frac{n!}{(n-m)!}Anm=n(n−1)(n−2)...(n−m+1)=(n−m)!n!
从 n 个不同元素中取出 m(m≤n) 个元素合成一组,叫做从 n 个元素中取出 m 个元素的一个组合(combination).
从 n 个不同元素中取出 m(m≤n) 个元素的所有不同组合的个数,叫做从 n 个不同元素中取出 m 个元素的组合数,用符号 CnmC_n^mCnm 表示.
Anm=n!m!(n−m)!A_n^m=\frac{n!}{m!(n-m)!}Anm=m!(n−m)!n!.
Cn0=1C_n^0=1Cn0=1.
Cnm=Cnn−mC_n^m=C_n^{n-m}Cnm=Cnn−m
Cn+1m=Cnm+Cnm−1C_{n+1}^m=C_n^m+C_n^{m-1}Cn+1m=Cnm+Cnm−1
1.1、二项式
二项式定理(binomial theorem):
(a+b)n=Cn0an+Cn1an−1b+...+Cnkan−kbk+...+Cnnbn (a+b)^n=C_n^0a^n+C_n^1a^{n-1}b+...+C_n^ka^{n-k}b^k+...+C_n^nb^n (a+b)n=Cn0an+Cn1an−1b+...+Cnkan−kbk+...+Cnnbn
2、随机变量及其分布
2.1、离散型随机变量及其分布列
随着实验结果变化而变化的变量称为随机变量(random variable).
所有取值可以一一列出的随机变量,称为离散型随机变量(discrete random variable).
概率分布列(probability distribution series),简称分布列.
| X | 0 | 1 |
|---|---|---|
| P | 1-p | p |
如上表,随机变量 X 服从两点分布(two-point distribution),称 p=P(X=1) 为成功概率.
| X | 0 | 1 | … | m |
|---|---|---|---|---|
| P | CM0CN−Mn−0CMn\frac{C_M^0C_{N-M}^{n-0}}{C_M^n}CMnCM0CN−Mn−0 | CM1CN−Mn−1CMn\frac{C_M^1C_{N-M}^{n-1}}{C_M^n}CMnCM1CN−Mn−1 | … | CMmCN−Mn−mCMn\frac{C_M^mC_{N-M}^{n-m}}{C_M^n}CMnCMmCN−Mn−m |
如上表,随机变量 X 服从超几何分布(hypergeometric distribution).
2.2、二项分布及其应用
P(B∣A)=P(AB)P(A)P(B|A)=\frac{P(AB)}{P(A)}P(B∣A)=P(A)P(AB) 表示在事件 A 发生的条件下,事件 B发生的条件概率(conditional probability),其中 P(AB)表示 A 和 B 同时发生的概率.P(B|A) 读作 A 发生的条件下 B 发生的概率.
如果 B 和 C 是两个互斥事件,则有 P(B∪C∣A)=P(B∣A)+P(C∣A)P(B∪C|A)=P(B|A)+P(C|A)P(B∪C∣A)=P(B∣A)+P(C∣A).
若 P(AB)=P(A)P(B)P(AB)=P(A)P(B)P(AB)=P(A)P(B),则称事件 A 与事件 B 相互独立(mutually independent).
一般地,在相同条件下重复做的 n 次试验称为 n 次独立重复试验(independent and repeated trials).
一般地,在 n 次独立重复试验中,用 X 表示事件 A 发生的次数,设每次试验中事件 A 发生的概率为 p,则有 P(X=k)=Cnkpk(1−p)n−k,k=0,1,2,...,n.P(X=k)=C_n^kp^k(1-p)^{n-k},k=0,1,2,...,n.P(X=k)=Cnkpk(1−p)n−k,k=0,1,2,...,n.
此时称随机变量 X 服从二项分布(binomial distribution),记作 X ~B(n,p)B(n,p)B(n,p),并称 p 为成功概率.
2.3、离散型随机变量的均值与方差
一般地,若离散型随机变量 X 的分布列为
| X | x1x_1x1 | x2x_2x2 | … | xix_ixi | … | xnx_nxn |
|---|---|---|---|---|---|---|
| P | p1p_1p1 | p2p_2p2 | … | pip_ipi | … | pnp_npn |
则称 E(x)=x1p1+x2p2+...+xipi+...+xnpnE(x)=x_1p_1+x_2p_2+...+x_ip_i+...+x_np_nE(x)=x1p1+x2p2+...+xipi+...+xnpn 为随机变量 X 的均值(mean) 或数学期望(mathematical expectation).
E(aX+b)=aE(X)+b.E(aX+b)=aE(X)+b.E(aX+b)=aE(X)+b.
若 X ~B(n,p)B(n,p)B(n,p),则 E(X)=np.
设离散型随机变量 X 的分布列为
| X | x1x_1x1 | x2x_2x2 | … | xix_ixi | … | xnx_nxn |
|---|---|---|---|---|---|---|
| P | p1p_1p1 | p2p_2p2 | … | pip_ipi | … | pnp_npn |
D(X)=∑i=1n(xi−E(X))2piD(X)=\sum_{i=1}^n(x_i-E(X))^2p_iD(X)=∑i=1n(xi−E(X))2pi,D(X) 为随机变量 X 的方差(variance),D(X)\sqrt[]{D(X)}D(X) 为随机变量 X 的标准差(standard deviation).
若 X 服从两点分布,则 D(X)=p(1−p)D(X)=p(1-p)D(X)=p(1−p);
若 X ~B(n,p),则 $D(X)=np(1-p)).
D(aX+b)=a2D(X)D(aX+b)=a^2D(X)D(aX+b)=a2D(X).
2.4、正态分布
φμ,σ(x)=12πσe−(x−μ)22σ2,x∈(−∞,+∞) φ_{μ,σ}(x)=\frac{1}{\sqrt[]{2π}σ}e^{-\frac{(x-μ)^2}{2σ^2}},x∈(-∞,+∞) φμ,σ(x)=2πσ1e−2σ2(x−μ)2,x∈(−∞,+∞)
其中 μ 和 σ(σ>0) 为参数,φμ,σ(x)φ_{μ,σ}(x)φμ,σ(x) 的图像为正太分布密度曲线,简称正态曲线.
X 落在区间(a,b] 的概率为 P(a<X≤b)=∫abφμ,σ(x)dxP(a<X≤b)=\int_a^bφ_{μ,σ}(x)dxP(a<X≤b)=∫abφμ,σ(x)dx.
正太分布记作 N(μ,σ2)N(μ,σ^2)N(μ,σ2),随机变量 X 服从正态分布,记为 X ~N(μ,σ2)N(μ,σ^2)N(μ,σ2).
正态曲线特点:
- 曲线位于 x 轴的上方,与 x 轴不相交;
- 曲线是单峰的,它关于直线 x=μ 对称;
- 曲线在 x=μ 处达到峰值 1σ2π\frac{1}{σ\sqrt[]{2π}}σ2π1;
- 曲线与 x 轴之间的面积为 1;
μ 反应随机变量取值的平均水平的特征数,曲线随着 μ 的变化沿 x 轴平移;
σ 越小,曲线越瘦高,总体分布越集中;σ 越大,曲线越矮胖,总体的分布越分散.
3、回归分析
- 样本点的中心;
- 随机误差;
- 解释变量;
- 预报变量;
- 残差;
- 独立性检验;
4、参考资料
普通高中课程标准实验教科书——数学2-3(选修)[ISBN 978-7-107-20171-4]

本文介绍了概率论与数理统计的基本概念,包括计数原理、随机变量的分布、二项分布、正态分布等内容,深入浅出地讲解了离散型随机变量的均值与方差,并探讨了回归分析等高级主题。
648

被折叠的 条评论
为什么被折叠?



