概率论与数理统计——概率论

ps:概率论说实话,它不会有什么小巧思、小技巧这些,大家只要把题目看懂,知道用什么公式(当然前提是把公式记住,公式记住了就包过了,然后都不需要特别理解,只要知道在哪用,就能考个较高分了),所以本篇就是提炼公式,方便大家一起记忆,然后让大家知道能在哪里用。

概率论的基本概念

概率模型

概型类型核心特征概率计算公式典型例子
古典概型

1. 基本事件有限个

2. 每个基本事件等可能

a = 事件A包含的基本事数;

b = 试验的基本事件总数

P(A) = \frac{a}{b}

掷骰子求点数为偶数的概率
几何概型

1. 基本事件无限个

2. 基本事件均匀分布于几何区域

\mu为长度/面积/体积

P(A)=\frac{\mu (A)}{\mu(\Omega )}

区间[0,5]随机取数落在[1,3]的概率
伯努利概型

1. n次独立重复试验

2. 每次试验仅两种结果(成功 / 失败)

3. 单次成功概率p固定

k为成功的次数;

q = 1 - p

P_{n}(k) = C_{n}^{k}p^{k}q^{n-k}

抛硬币 5 次恰好 3 次正面的概率

概率关系

特征维度互斥关系独立关系
本质事件不能同时发生(集合无交集)事件发生互不影响(概率满足乘积公式)
概率判定条件

P(AB) = 0

(注意:互斥能推出P(AB)=0,但P(AB)=0不一定互斥)

P(AB) = P(A) \cdot P(B)

(充要条件)

适用场景单次试验的不同结果(如一次掷骰子的不同点数)多次独立试验的结果(如两次抛硬币)
特殊情况若 P(A)>0 且 P(B)>0,则互不相容一定不独立若 P(A)=0 或 P(B)=0,则事件既独立又可能互不相容

概率公式

加法公式

  • 通用形式:P(A\cup B)=P(A)+P(B)-P(AB)
  • 互斥特例:P(A \cup B) = P(A) + P(B)

条件概率公式

设P(B) > 0,在事件B发生的条件下,事件A发生的概率为:

P(A|B) = \frac{P(AB)}{P(B)}

乘法公式

  • 通用形式:P(AB) = P(B)P(A|B) = P(A)P(B|A)
  • 独立特例:P(AB) =P(A)P(B)

全概率公式

前提:事件组A1,A2,...,An两两互斥;\bigcup_{i=1}^{n}A_{i}=\Omega(完备事件组);P(Ai) > 0(i = 1, 2, ..., n)。

P(B)=\sum_{i=1}^{n}P(A_{i})P(B|A_{i})

贝叶斯公式

前提:同全概率公式的完备事件组A1,A2,...,An,且P(B) > 0。

P(A_{i}|B)=\frac{P(A_{i})P(B|A_{i})}{\sum_{j=1}^{n}P(A_{j})P(B|A_{j})}

随机变量

分布函数

设X是一个随机变量,分布函数F(x)定义为:

F(x)=P\left \{ X \leq x \right \},x \in R

其含义是:随机变量X取值小于等于x的概率。

单调性:若x1 < x2,则F(x1) ≤ F(x2)。

有界性:0 ≤ F(x) ≤ 1。

概率计算:对任意实数a,b(a < b),有 P\left \{ a < X \leq b \right \} = F(b) - F(a)

离散型随机变量

取值为有限个或可列无限个的随机变量

分布律(概率质量函数):设 X 的可能取值为 x1, x2, ..., xn, ...,则 P{X = xk} = pk, k = 1, 2, ...称为 X 的分布律,常用表格形式表示:

Xx1x2···xn···
Pp1p2···pn···

三个重要离散型分布

分布类型符号分布律适用场景核心参数
0-1 分布X\sim B(1,p)

P\left \{ X=k \right \}=p^{k}(1-p)^{1-k}

k=0,1

单次伯努利试验(只有两种结果)p(成功概率,0<p<1 )
二项分布X\sim B(n,p)

P\left \{ X=k \right \}=C_{n}^{k}p^{k}q^{n-k}

k =0,1,...,n;q=1-p

n 重伯努利试验中成功的次数n(试验次数)、p(单次成功概率)
泊松分布X\sim P(\lambda)

P\left \{ X=k \right \}=\frac{\lambda^{k}e^{-\lambda}}{k!}

k = 0,1,...

稀有事件发生的次数(如事故、故障数)\lambda(均值,\lambda > 0 )

补充关系:当n很大、p很小时,二项分布可近似为泊松分布,即 B(n,p) \approx P(\lambda)

连续型随机变量

取值充满某个区间,且存在非负可积函数f(x),使得其分布函数可表示为积分形式的随机变量。

概率密度函数:满足 F(x) = \int_{-\infty }^{x}f(t)dt,x\in R 的函数 f(x) 称为X的概率密度函数。

概率密度的性质:

  1. 非负性:f(x) \geq 0, x \in R
  2. 归一性\int_{-\infty}^{+\infty}f(x)dx = 1
  3. 概率计算:对于任意 a ≤ b,有 P\left \{ a < X \leq b \right \} = F(b) - F(a) = \int_{a}^{b}f(x)dx

分布函数:是连续函数,且在f(x)的连续点处有 {F}'(x)=f(x)

三个重要连续型分布

分布类型符号概率密度 f(x)适用场景核心参数
均匀分布X \sim U(a, b)

f(x) = \frac{1}{b-a},a<x<b

f(x) = 0,x\leq a|x\geq b

试验结果在区间 (a,b) 内均匀出现a,b(区间端点,a <b
指数分布X \sim E(\lambda)

f(x) = \lambda e^{-\lambda x},x> 0

f(x) = 0 , x \leq 0

描述寿命、等待时间等\lambda(率参数,\lambda > 0
正态分布X \sim N(\mu, \sigma^{2} )f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{-(x-\mu)^{2}}{2\sigma^{2}}},x \in R自然界大量随机现象(如身高、成绩)\mu(均值)、\sigma^{2}(方差)

标准正态分布

  • 当 \mu = 0, \sigma^{2} = 1 时,记为 X \sim N(0,1),其密度函数为 \varphi (x) = \frac{1}{\sqrt{2\pi}}e^{-\frac{x^{2}}{2}},分布函数为 \Phi (x)=P \left \{ X \le x \right \}= \int_{-\infty}^{x}\varphi (t)dt
  • 一般正态分布可以通过标准化 Z = \frac{X-\mu}{\sigma} \sim N(0, 1) 计算概率。
  • \Phi (-x) = P\left \{X \le -x \right \} = P\left \{ X \geq x \right \} = 1-P\left \{ X \le x \right \} = 1 - \Phi(x)

随机变量函数的分布

设 X 是随机变量,y = g(x)是连续函数,则 Y = g(X) 也是随机变量,需根据 X 的类型求 Y 的分布

1.离散型随机变量函数的分布

设 X 的分布律为 P\left \{ X = x_{k} \right \} = p_{k}(k=1,2,...),则 Y = g(X) 的分布律求解步骤:

  1. 计算 Y 的可能取值:y_{k} = g(x_{k})(k = 1, 2, ...)
  2. 合并相同的 y_{k} 对应的概率:P\left \{ Y = y_{i} \right \}=\sum_{g(x_{k}) = y_{i}}^{} P\left \{ X=x_{k} \right \}

2.连续型随机变量函数的分布

设 X 的概率密度为 f_{X}(x),求 Y = g(x) (函数 g(x) 为单调函数)的概率密度 f_Y(y),常用分布函数法

f_{Y}(y) = f_{X}(h(y)) | {h}'(y)|, \alpha < y < \beta

f_{Y}(y) = 0,其它

其中:\alpha , \beta 分别为 g(x) 的最大值,最小值;h(y) 是 g(x) 的反函数

多维随机变量

二维随机变量的边缘分布

1.二维离散型随机变量:联合分布律与边缘分布律

1)联合分布律

设二维离散型随机变量(X, Y)的可能取值为 (xi, yi) (i,j = 1, 2, ...),则称

P\left \{ X = x_{i}, Y = y_{i} \right \}= p_{ij},\: \: \: \: i,j = 1, 2,...

为(X, Y) 的联合分布律

2)边缘分布律

关于 X 的边缘分布律:固定 X = xi,对所有 j 的概率求和,即       

          P\left \{ X = x_{i} \right \} = \sum_{j=1}^{\infty}p_{ij}, \: \: \: \: i = 1, 2, ...

关于 Y 的边缘分布律:固定 X = yi,对所有 i 的概率求和,即       

          P\left \{ Y = y_{j} \right \} = \sum_{i=1}^{\infty}p_{ij}, \: \: \: \: j = 1, 2, ...

2.二维连续型随机变量;联合概率密度与边缘概率密度

1)联合概率密度

设二维连续型随机变量 (X,Y) 的分布函数为 F(x,y) = P{ X ≤ x,Y ≤ y },若存在非负可积函数 f(x,y),使得对任意实数 x,y 有:

F(x, y) = \int_{-\infty}^{y} \int_{-\infty}^{x}f(u,v)dudv

则称 f(x, y) 为 (X, Y) 的联合概率密度。

2)边缘概率密度

关于 X 的边缘概率密度:对联合概率密度 f(x, y) 关于 y 积分,即

f_{X}(x) = \int_{-\infty}^{+\infty}f(x,y)dy

关于 Y 的边缘概率密度:对联合概率密度 f(x, y) 关于 x 积分,即

f_{Y}(y) = \int_{-\infty}^{+\infty}f(x,y)dx

性质\int_{-\infty}^{+\infty}f_{X}(x)dx = 1,\: \: \: \: \int_{-\infty}^{+\infty}f_{Y}(y)dy = 1

随机变量独立性的判别

定义:联合分布律等于两个边缘分布律的乘积

F(x, y) = F_{X}(x) \cdot F_{Y}(y)

则称随机变量 X 与 Y 相互独立。

1.离散型随机变量的独立性判别

对所有 i, j,有

p_{ij}=p_{i} \cdot p_{j}

2.连续型随机变量的独立性判断

对几乎所有的 x, y,有

f(x,y) = f_{X}(x) \cdot f_{Y}(y)

二维离散型随机变量函数的分布律

设二维随机变量 (X, Y) 的联合分布律为 P{ X = xi, Y = yi } = pij, Z = g(X, Y) 是 X, Y 的函数,则 Z 为离散型随机变量,其分布律:

1.确定 Z 的所有可能取值

计算 z_{k} = g(x_{i}, y_{i}),整理得到 Z 的不同取值

2.计算每个 zk 对应的概率

对所有满足 g(xi, yi) = zk 的 (i, j) 对应的概率求和,

P\left \{ Z = z_{k} \right \} = \sum_{g(x_{i}, y_{i}) = z_{k}} p_{ij},\: \: \: \: k=1, 2, ...

二维连续型随机变量函数的分布(和、最大值、最小值)

设二维连续型随机变量 (X, Y) 的联合概率密度为 f(x, y),Z = g(X, Y),采用分布函数法:

先求 Z 的分布函数 F_{Z}(z) = P\left \{ g(X, Y) \le z \right \}再求导得概率密度

1.和的分布:Z = X + Y

1)分布函数

F_{Z}(z) = P\left \{ X+Y\le z \right \}

= \int\int_{x+y \le z}f(x,y)dxdy=\int_{-\infty}^{+\infty}dx \int_{-\infty}^{z-x}f(x,y)dy

2)概率密度

对 Fz(z)求导,得

f_{Z}(z) = \int_{-\infty}^{+\infty}f(x, z-x)dx

若 X 与 Y 相互独立,则(卷积公式)

f_{Z}(z) = f_{-\infty}^{+\infty}f_{X}(x)f_{Y}(z-x)dx

特例:若 X \sim N(\mu_{1}, \sigma_{1}^{2}),\: \: Y\sim N(\mu_{2},\sigma_{2} ^{2}),且 X 与 Y 独立,则 

Z = X + Y \sim N(\mu_{1} + \mu_{2}, \sigma_{1}^{2} +\sigma_{2}^{2})

例题:

2.最大值的分布:Z = max( X, Y )

假设 X 与 Y 相互独立,边缘分布函数分别为 Fx(x) 和 Fy(y)。

1)分布函数

F_{max}(z) = P\left \{ max(X, Y) \le z \right \}

= P\left \{ X \le z, Y \le z \right \} = F_{X}(z) \cdot F_{Y}(z)

2)概率密度

f_{max}(z) = {F}'_{max}(z) = f_{X}(z)F_{Y}(z) + F_{X}(z)f_{Y}(z)

3.最小值的分布:Z = min( X, Y )

假设 X 与 Y 相互独立,边缘分布函数分别为 Fx(x) 和 Fy(y)。

1)分布函数

F_{min}(z) = P\left \{ min(X, Y) \le z \right \} = 1 - P\left \{ min(X, Y) > z \right \}

=1-P\left \{ X > z, Y > z \right \} = 1-[1-F_{X}(z)][1-F_{Y}(z)]

2)概率密度

f_{min}(z) = {F}'_{min}(z) = f_{X}(z)[1 - F_{Y}(z)] + [1 - F_{X}(z)]f_{Y}(z)

随机变量的数字特征

随机变量的期望

1)离散型随机变量

设离散型随机变量 X 的分布律为 P{ X = xk } = pk, k = 1, 2, ...,则 X 的数学期望(简称期望或均值) :

E(X) = \sum_{k=1}^{\infty}x_{k}p_{k}

2)连续型随机变量

设连续型随机变量 X 的概率密度为 f(x),则 X 的期望:

E(X) = \int_{-\infty}^{+\infty}xf(x)dx

如果求的是 E(g(X)) ,概率密度是不变的:

E(g(x)) = \int_{-\infty}^{+\infty}g(x)f(x)dx

期望的核心性质:

  1. 常数的期望:E(C) = C(C为常数)
  2. 数乘性质:E(CX) = C \cdot E(X)(C为常数)
  3. 加法性质:E(X + Y) = E(X) + E(Y)
  4. 独立乘积性质:若 X 与 Y 独立,E(XY) = E(X) \cdot E(Y)

随机变量的方差

D(X) = E(X^{2}) - \left [ E(X) \right ]^{2}

方差的核心性质:

  1. 常数的方差:D(C) = 0(C为常数)
  2. 数乘性质:D(CX) = C^{2}\cdot D(X)(C为常数)
  3. 独立加法性质:若 X 与 Y 相互独立,则 D(X\pm Y) = D(X) +D(Y)
  4. 方差非负性:D(X) \geq 0,且 D(x) = 0 的充要条件是 P\left \{ X = E(X) \right \} = 1

六大重要分布的期望与方差

分布类型符号期望 E(X)方差 D(X)
0-1 分布X \sim B(1,p)pp(1-p)
二项分布X \sim B(n,p)npnp(1-p)
泊松分布X \sim P(\lambda)\lambda\lambda
均匀分布X \sim U(a,b)\frac{a+b}{2}\frac{(b-a)^{2}}{12}
指数分布X \sim E(\lambda)\frac{1}{\lambda}\frac{1}{\lambda^{2}}
正态分布X \sim N(\mu,\sigma^{2})\mu\sigma ^{2}

协方差与相关系数

1)协方差

计算公式:Cov(X, Y) = E(XY) - E(X) \cdot E(Y)

核心性质:

  1.  Cov(X,Y) = Cov(Y, X)
  2.  Cov(X,C) = 0(C为常数)
  3.  Cov(aX, bY) = ab\cdot Cov(X, Y)(a,b为常数)
  4.  Cov(X_{1}+X_{2}, Y)=Cov(X_{1}, Y) + Cov(X_{2}, Y)
  5. 方差与协方差的关系:D(X\pm Y) = D(X) + D(Y) \pm 2Cov(X, Y) 

2)相关系数

计算公式:\rho_{xy} = \frac{Cov(X, Y)}{\sqrt{D(X)} \sqrt{D(Y)}}

核心性质:

  1. 有界性:\left | \rho_{xy} \right | \le 1
  2. 不相关性:若 \rho_{xy} = 0,则称 X 与 Y 不相关(充要条件);若 X 与 Y 相互独立,则 X 与 Y 一定不相关,但反之不成立。

大数定理与中心极限定理

切比雪夫不等式的应用

设随机变量 X 的期望 E(X) = \mu,方差 D(X) = \sigma ^{2} 存在,则对任意 \xi > 0,有:

P\left \{ |X-\mu| \geq \xi \right \} \le \frac{\sigma^{2}}{\xi^{2}}

等价形式:P\left \{ |X-\mu| < \xi \right \} \geq 1- \frac{\sigma^{2}}{\xi^{2}}

核心特点:

  • 不需要知道 X 的具体分布,只要期望和方差存在即可使用
  • 得到的概率界不是精确值,而是一个范围,一般不会直接拿这个来估计概率的,而是用中心极限定理。

例题:

在每次试验中,事件A发生的概率为0.5,利用切比雪夫不等式估计,在1000次独立重复试验中,事件A发生的次数在400至600之间的概率至少为多少。
P\left \{400 < X < 600\right \} = P \left \{ |X-500| < 100 \right \} = 1 - \frac{250}{100^{2}} = \frac{39}{40}

大数定理的应用(一般都不会用来做题,了解一下就行)

1)切比雪夫大数定理(独立但不一定同分布)

\lim_{n \to \infty}P \left \{ |\frac{1}{n} \sum_{i=1}^{n} X_{i}-\frac{1}{n}\sum_{i=1}^{n}\mu_{i}| < \xi \right \} = 1

2)辛钦大数定理(独立同分布,仅需期望存在)

\lim_{n \to \infty}P \left \{ |\frac{1}{n} \sum_{i=1}^{n} X_{i}-\mu| < \xi \right \} = 1

3)伯努利大数定理(频率趋近于概率)

\lim_{n \to \infty}P \left \{ |\frac{n_{A}}{n}-p| < \xi \right \} = 1

中心极限定理的应用(常用)

核心特点:大量独立同分布的随机变量之和,无论原分布是什么,其极限分布都是正态分布

1)林德伯格-列维定理(独立同分布

设随机变量 X 的期望 E(X) = \mu,方差 D(X) = \sigma ^{2} ,\Phi (x) 是标准正态分布 N(0, 1) 的分布函数。

\lim_{n \to \infty}P \left \{ \frac{\sum_{i=1}^{n}X_{i}-n\mu}{\sqrt {n\sigma^{2}}} \le x \right \} = \Phi (x)

当 n 充分大时,\sum_{k=1} ^{n} X_{k} \sim N(n\mu, n\sigma ^{2}),也就是 Y_{n} = \frac{\sum_{k=1}^{n}X_{k}-n\mu}{\sqrt{n\sigma^{2}}} \sim N(0,1)

例题:
检验员逐件地检查某种产品,每次花 10 秒钟检查一件,但也可能有的产品需要重复检查一次再用去 10 秒钟。假定每件产品需要重复检查的概率为 1 2,求在 8 小时内检验员检查的产品多于 1900 件的概率。

2)棣莫弗-拉普拉斯定理(二项分布的正态近似

设 X ~ B(n, p)(n重伯努利试验成功次数),则对任意实数 x:

\lim_{n \to \infty}P \left \{ \frac{X-np}{\sqrt{np(1-p)}} \le x \right \} = \Phi (x)

当 n 充分大时,也就是 Y_{n} = \frac{X-np}{\sqrt{np(1-p)}} \sim N(0,1)

例题:

某车间有同型号机床 200 部,每部开动的概率为 0.7,假定各机床开关是独立的,开动时每部要消耗电能 15 个单位。向电厂最少要供应这个车间多少电能,才能以 95%的概率保证不会因供电不足而影响生产?

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值