概率统计——随机事件与随机变量

随机事件

基本概念

名词符号概念
随机现象现实生活中,一个动作或事情,在一定条件下,所得的结果不能预先完全确定,只能确定是多种可能结果中的一种的现象。
随机试验E使随机现象得以实现和对它观察的全过程称为随机试验。
样本空间Ω随机试验所有可能结果组成的集合
样本点ω试验的每一个可能结果
随机事件A, B, C, ……样本空间中满足一定条件的子集。
事件发生在试验中,称一个事件发生是指构成该事件的一个样本点出现。
必然事件由于样本空间Ω包含了所有的样本点,所以在每次试验中,样本空间总是发生,因此称Ω为必然事件
不可能事件空集不包含任何样本点,且在每次试验中总不发生,所以称为不可能事件。

【注意】:

  1. 随机试验需要满足三个条件:q
    (1)可以在相同条件下重复进行;
    (2)结果有多种可能性,并且所有可能结果事先已经知道;
    (3)做一次试验究竟哪个结果出现,事先不能确定。
  2. 随机事件在随机试验中可能出现,也可能不出现。

【举例说明】:掷色子。

  1. 样本点:出现的“1,2,3,4,5,6”中的任何一个数字都是一个样本点。
  2. 样本空间:所有样本点的集合,即Ω={1,2,3,4,5,6}.
  3. 随机事件(在一定条件下):出现数字是偶数的结果,A={2,4,6}.
  4. A是Ω的一个子集。
  5. 不可能事件:出现的结果大于6。用空集表示。

概率

定义

随机试验E的样本空间为Ω,对于每一个事件A,定义一个实数P(A)与之对应,若函数P(.)满足条件:

  1. 对于每一个事件A,都有0<P(A)≤1;
  2. P(Ω)=1;
  3. 若事件 A 1 , A 2 , A 3 , … A_1,A_2,A_3,… A1,A2,A3,两两互斥,即,当i,j=1,2,…,且i≠j, A i ∩ A j = ∅ A_i∩A_j=∅ AiAj=时,均有 P ( A 1 ∪ A 2 ∪ … ) = P ( A 1 ) + P ( A 2 ) + … P(A_1∪A_2∪…)=P(A_1)+P(A_2)+… P(A1A2)=P(A1)+P(A2)+

则称P(A)为事件A的概率。

主要性质

  1. 对于任一事件A,均有 P ( A ˉ ) = 1 − P ( A ) P(\bar{A})=1-P(A) P(Aˉ)=1P(A);
  2. 对于两个事件A和B,若 A ⊂ B A\subset B AB,则有 P ( B − A ) = P ( B ) − P ( A ) , P ( B ) > P ( A ) P(B-A)=P(B)-P(A),P(B)>P(A) P(BA)=P(B)P(A)P(B)>P(A);
  3. 对于任意两个事件A和B,有 P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A ∩ B ) P(A\cup B)=P(A)+P(B)-P(A\cap B) P(AB)=P(A)+P(B)P(AB)

【举例说明】:掷色子,每个数字出现的概率是 1 6 \frac {1} {6} 61。令A={1,2},B={1,2,3}, A ˉ \bar A Aˉ={3,4,5,6}。 P ( A ) = 1 3 , P ( B ) = 1 2 P(A)=\frac {1} {3},P(B)=\frac {1} {2} P(A)=31,P(B)=21

  • P ( A ˉ ) = 1 − P ( A ) = 1 − 1 3 = 2 3 P(\bar A)=1-P(A)=1-\frac {1} {3}=\frac {2} {3} P(Aˉ)=1P(A)=131=32
  • P ( B − A ) = P ( B ) − P ( A ) = 1 2 − 1 3 = 1 6 P(B-A)=P(B)-P(A)=\frac {1} {2}-\frac {1} {3}=\frac {1} {6} P(BA)=P(B)P(A)=2131=61
  • P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A ∩ B ) = 1 3 + 1 2 − 1 3 = 1 2 , 其 中 A ∩ B = A . P(A\cup B)=P(A)+P(B)-P(A\cap B)=\frac {1} {3}+\frac {1} {2}-\frac {1} {3}=\frac {1} {2},其中A\cap B=A. P(AB)=P(A)+P(B)P(AB)=31+2131=21,AB=A.

古典概型

古典概型公式

样 本 空 间 Ω = n , 事 件 A 包 含 m 个 样 本 点 , 则 事 件 A 的 概 率 定 义 为 : 样本空间\Omega=n,事件A包含m个样本点,则事件A的概率定义为: Ω=n,AmA:
P ( A ) = m n = 事 件 A 包 含 的 基 本 事 件 数 基 本 事 件 总 数 P(A)=\frac {m} {n}=\frac {事件A包含的基本事件数} {基本事件总数} P(A)=nm=A

浅析排列组合

排列和组合的本质区别:决策的顺序对结果有没有影响。

排列(Arrangement)
  • 排列的定义:
    • 从n个不同元素中,任取m(m≤n,m与n均为自然数,下同)个不同的元素按照一定的顺序排成一列,叫做从n个不同元素中取出m个元素的一个排列
    • 从n个不同元素中取出m(m≤n)个元素的所有排列的个数,叫做从n个不同元素中取出m个元素的排列数,用符号 A n m A_n^m Anm表示。
  • 计算公式:
    • A n m = n ( n − 1 ) ( n − 2 ) ( n − 3 ) ⋯ ( n − m + 1 ) = n ! ( n − m ) ! A_n^m=n(n-1)(n-2)(n-3)\cdots(n-m+1)=\frac {n!} {(n-m)!} Anm=n(n1)(n2)(n3)(nm+1)=(nm)!n!
组合(Combination)
  • 组合的定义:
    • 从n个不同元素中,任取m(m≤n)个元素并成一组,叫做从n个不同元素中取出m个元素的一个组合
    • 从n个不同元素中取出m(m≤n)个元素的所有组合的个数,叫做从n个不同元素中取出m个元素的组合数。用符号 C n m C_n^m Cnm表示。
  • 计算公式:
    • C n m = A n m m ! = n ! m ! ( n − m ) ! ; C n m = C n n − m C_n^m=\frac {A_n^m} {m!}=\frac {n!} {m!(n-m)!};C_n^m=C_n^{n-m} Cnm=m!Anm=m!(nm)!n!;Cnm=Cnnm

例题

假设有k个不同颜色的球,每个球以同样的概率 1 l \frac {1} {l} l1落到 l ( l ≥ k ) l(l \ge k) l(lk)个格子的每个中,且每个盒子可以容纳任意多个球。分别求出以下两个事件A和B的概率。

  1. 指定的k个格子中各有一个球;
  2. 存在k个格子,其中各有一个球。

【解析】:

  • 由于每个格子可以放任意个球,所以k个球放入一个格子里面就有k种可能,一共有 l l l个格子,所以样本空间就是 l k l^k lk
  • A事件的意思就是在 l l l个格子中选出k个格子来放k个球,也就是 A k k A_k^k Akk。所以, P ( A ) = A k k l k P(A)=\frac {A_k^k} {l^k} P(A)=lkAkk
  • 对于B事件,首先我们要从 l l l个格子里面随机选出k个格子,也就是 C l k C_l^k Clk,其次,选出的k个格子要放k个球,也就是 A k k A_k^k Akk,即一共是 C l k × A k k C_l^k×A_k^k Clk×Akk,从而得知, P ( B ) = C l k × A k k l k P(B)=\frac {C_l^k×A_k^k} {l^k} P(B)=lkClk×Akk

条件概率

设 A 和 B 是 两 个 事 件 , 且 P ( B ) > 0 , 称 P ( A ∣ B ) = P ( A B ) P ( B ) , 为 事 件 B 发 生 的 条 件 下 , 事 件 A 发 生 的 概 率 。 设A和B是两个事件,且P(B)>0,称P(A|B)=\frac {P(AB)} {P(B)},为事件B发生的条件下,事件A发生的概率。 ABP(B)0P(AB)=P(B)P(AB)BA
由此推导出,概率的乘法公式为: P ( A B ) = P ( A ∣ B ) P ( B ) = P ( B ∣ A ) P ( A ) P(AB)=P(A|B)P(B)=P(B|A)P(A) P(AB)=P(AB)P(B)=P(BA)P(A)

全概率公式

设 B 1 , B 2 , ⋯ 是 样 本 空 间 Ω 的 一 个 划 分 , A 为 任 一 事 件 , 则 设B_1,B_2,\cdots是样本空间\Omega的一个划分,A为任一事件,则 B1,B2,ΩA
P ( A ) = ∑ i = 1 ∞ P ( B i ) P ( A ∣ B i ) , P(A)=\sum_{i=1}^{\infty}P(B_i)P(A|B_i), P(A)=i=1P(Bi)P(ABi)
称 为 全 概 率 公 式 。 称为全概率公式。

【补充】:
如果事件组满足 B 1 , B 2 , ⋯ B_1,B_2,\cdots B1,B2,两两互斥,且 P ( B i ) > 0 , i = 1 , 2 , ⋯   , B 1 ∪ B 2 ∪ ⋯ = Ω , 则 称 事 件 组 B 1 , B 2 , ⋯ 是 样 本 空 间 Ω 的 一 个 划 分 。 P(B_i)>0,i=1,2,\cdots,B_1\cup B_2\cup\cdots=\Omega,则称事件组B_1,B_2,\cdots是样本空间\Omega的一个划分。 P(Bi)>0,i=1,2,,B1B2=Ω,B1,B2,Ω

【本质】
全 概 率 就 是 表 示 达 到 某 个 目 的 , 有 多 种 方 式 ( 或 者 造 成 某 种 结 果 , 有 多 种 原 因 ) , 问 达 到 目 的 的 概 率 是 多 少 ( 造 成 这 种 结 果 的 概 率 是 多 少 ) ? \color {red}{全概率就是表示达到某个目的,有多种方式(或者造成某种结果,有多种原因),问达到目的的概率是多少(造成这种结果的概率是多少)?}

贝叶斯公式

设 B 1 , B 2 , ⋯ 是 样 本 空 间 Ω 的 一 个 划 分 , 则 对 任 一 事 件 A ( P ( A ) > 0 ) 有 设B_1,B_2,\cdots是样本空间\Omega的一个划分,则对任一事件A(P(A)>0)有 B1,B2,ΩA(P(A)>0)
P ( B i ∣ A ) = P ( B i A ) P ( A ) = P ( A ∣ B i ) P ( B i ) ∑ j = 1 ∞ P ( B j ) P ( A ∣ B j ) , i = 1 , 2 , ⋯ P(B_i|A)=\frac {P(B_iA)} {P(A)}=\frac {P(A|B_i)P(B_i)} {\sum_{j=1}^{\infty}P(B_j)P(A|B_j)},i=1,2,\cdots P(BiA)=P(A)P(BiA)=j=1P(Bj)P(ABj)P(ABi)P(Bi),i=1,2,
称上式为贝叶斯公式,称 P ( B i ) ( i = 1 , 2 , ⋯   ) P(B_i)(i=1,2,\cdots) P(Bi)(i=1,2,)先验概率 P ( B i ∣ A ) ( i = 1 , 2 , ⋯   ) P(B_i|A)(i=1,2,\cdots) P(BiA)(i=1,2,)后验概率

【本质】
贝 叶 斯 公 式 就 是 当 已 知 结 果 , 问 导 致 这 个 结 果 的 第 i 原 因 的 可 能 性 是 多 少 ? 执 果 索 因 ! \color {red}{贝叶斯公式就是当已知结果,问导致这个结果的第i原因的可能性是多少?执果索因!} i

随机变量

随机变量&&随机变量的分布函数

随机变量

设E是随机试验, Ω \Omega Ω是样本空间,如果对于每一个 ω ⊂ Ω \omega \subset \Omega ωΩ。都有一个确定的实数 X ( ω ) X(\omega) X(ω)与之对应,若对于任意实数 x ⊂ R x\subset R xR,有{ ω : X ( ω ) < x \omega :X(\omega) <x ω:X(ω)<x},则称 Ω \Omega Ω上的单值实函数 X ( ω ) X(\omega) X(ω)为一个随机变量。

随机变量的分布函数

设 X 是 一 个 随 机 变 量 , 对 于 任 意 实 数 x , 令 设X是一个随机变量,对于任意实数x,令 Xx
F ( x ) = { X < x } , x ∈ R F(x)=\lbrace{X<x} \rbrace,x\in R F(x)={X<x},xR
称 F ( x ) 为 随 机 变 量 X 的 分 布 函 数 , 也 称 为 概 率 累 计 函 数 。 称F(x)为随机变量X的分布函数,也称为概率累计函数。 F(x)X

离散型随机变量

如 果 随 机 变 量 X 的 全 部 可 能 取 值 只 有 有 限 多 个 或 可 列 无 穷 多 个 , 则 称 X 为 离 散 型 随 机 变 量 。 如果随机变量X的全部可能取值只有有限多个或可列无穷多个,则称X为离散型随机变量。 XX

对 于 离 散 型 随 机 变 量 X 可 能 取 值 为 x k 的 概 率 为 : 对于离散型随机变量X可能取值为x_k的概率为: Xxk
P { X = x k } = p k , k = 1 , 2 , ⋯ P\lbrace{X=x_k}\rbrace=p_k,k=1,2,\cdots P{X=xk}=pk,k=1,2,
则 称 上 式 为 离 散 型 随 机 变 量 X 的 分 布 律 。 则称上式为离散型随机变量X的分布律。 X

离 散 性 随 机 变 量 的 分 布 函 数 为 : 离散性随机变量的分布函数为:
F ( x ) = P { X < = x } = ∑ x k < = x P { X = x k } = ∑ x k < = x P k F(x)=P\lbrace{X<=x}\rbrace=\sum_{x_k<=x}P\lbrace{X=x_k}\rbrace=\sum_{x_k<=x}P_k F(x)=P{X<=x}=xk<=xP{X=xk}=xk<=xPk

常见的离散型分布

二项分布(Bernoulli分布)

  1. Bernoulli(伯努利)试验
    如果一个随机试验只有两种可能结果 A 和 A ˉ A和\bar A AAˉ,并且
    P ( A ) = p , P ( A ˉ ) = 1 − p = q P(A)=p,P(\bar A)=1-p=q P(A)=p,P(Aˉ)=1p=q
    其 中 , 0 < p < 1 , 则 称 此 实 验 为 B e r n o u l l i 试 验 。 B e r n o u l l i 试 验 重 复 进 行 n 次 , 称 为 n 重 B e r n o u l l i 试 验 。 其中,0<p<1,则称此实验为Bernoulli试验。Bernoulli试验重复进行n次,称为n重Bernoulli试验。 0<p<1,BernoulliBernoullinnBernoulli
  2. 二项分布
    设 A = { n 重 B e r n o u l l i 试 验 中 A 出 现 k 次 } , 则 设A=\lbrace{n重Bernoulli试验中A出现k次}\rbrace,则 A={nBernoulliAk}
    P ( A k ) = C n k P k ( 1 − p ) n − k , k = 0 , 1 , 2 , ⋯   , n P(A_k)=C_n^kP^k(1-p)^{n-k},k=0,1,2,\cdots,n P(Ak)=CnkPk(1p)nk,k=0,1,2,,n
    此 为 二 项 分 布 , 记 作 B ( n , k ) 。 此为二项分布,记作B(n,k)。 B(n,k)
  3. 分布函数
    若 随 机 变 量 X 的 分 布 律 为 : P ( X = k ) = C n k P k ( 1 − p ) n − k , k = 0 , 1 , 2 , ⋯   , n , 其 分 布 函 数 为 : 若随机变量X的分布律为:P(X=k)=C_n^kP^k(1-p)^{n-k},k=0,1,2,\cdots,n,其分布函数为: XP(X=k)=CnkPk(1p)nk,k=0,1,2,,n,
    F ( x ) = ∑ k = ⌊ x ⌋ C n k P k ( 1 − p ) n − k , k = 0 , 1 , 2 , ⋯   , n F(x)=\sum_{k=}^{\lfloor x \rfloor}C_n^kP^k(1-p)^{n-k},k=0,1,2,\cdots,n F(x)=k=xCnkPk(1p)nk,k=0,1,2,,n
    其 中 ⌊ x ⌋ 表 示 向 下 取 整 , 即 不 超 过 x 的 最 大 整 数 。 其中\lfloor x \rfloor 表示向下取整,即不超过x的最大整数。 xx

随机变量的数字特征

数学期望(均值)——离散型/连续型

  1. 离散型:
    设 离 散 型 随 机 变 量 X 的 分 布 律 为 P ( X = x i ) = p i , i = 1 , 2 , ⋯   , 若 级 数 ∑ i ∣ x i ∣ p i 收 敛 , 则 称 级 数 ∑ i x i p i 的 和 为 随 机 变 量 X 的 数 学 期 望 。 记 作 E ( X ) , 即 : 设离散型随机变量X的分布律为P(X=x_i)=p_i,i=1,2,\cdots,若级数\sum_i|x_i|p_i收敛,则称级数\sum_ix_ip_i的和为随机变量X的数学期望。记作E(X),即: XP(X=xi)=pi,i=1,2,,ixipiixipiXE(X),
    E ( X ) = ∑ i x i p i E(X)=\sum_ix_ip_i E(X)=ixipi
  2. 连续型:
    设 连 续 型 随 机 变 量 X 的 概 率 密 度 函 数 为 f ( x ) , 若 积 分 ∫ − ∞ + ∞ ∣ x ∣ f ( x ) d x 的 值 为 随 机 变 量 X 的 数 学 期 望 。 记 作 E ( X ) , 即 : 设连续型随机变量X的概率密度函数为f(x),若积分\int_{-\infty}^{+\infty}{|x|f(x)}dx的值为随机变量X的数学期望。记作E(X),即: Xf(x)+xf(x)dxXE(X)
    E ( X ) = ∫ − ∞ + ∞ x f ( x ) d x E(X)=\int_{-\infty}^{+\infty}{xf(x)}dx E(X)=+xf(x)dx

【注意】:数学期望代表了随机变量取值的平均值,是一个非常重要的数学特征。
【数学期望的特征】:

  • 若 c 是 常 数 , 则 E ( c ) = c ; 若c是常数,则E(c)=c; cE(c)=c;
  • E ( a X + b Y ) = a E ( X ) + b E ( Y ) , 其 中 a , b 是 任 意 常 数 ; E(aX+bY)=aE(X)+bE(Y),其中a,b是任意常数; E(aX+bY)=aE(X)+bE(Y),ab
  • 若 X , Y 相 互 独 立 , 则 E ( X Y ) = E ( X ) E ( Y ) ; 若X,Y相互独立,则E(XY)=E(X)E(Y); XYE(XY)=E(X)E(Y);

方差、均方差(标准差)、协方差、相关系数

  1. 方差、均方差(标准差):
    设 X 为 随 机 变 量 , 如 果 E { [ X − E ( X ) ] 2 } 为 X 的 设X为随机变量,如果E\lbrace{[X-E(X)]^2}\rbrace为X的 XE{[XE(X)]2}X方差 记 作 V a r ( X ) , 即 : 记作Var(X),即: Var(X)
    V a r ( X ) = E { [ X − E ( X ) ] 2 } Var(X)=E\lbrace{[X-E(X)]^2}\rbrace Var(X)=E{[XE(X)]2}
    并 且 称 V a r ( X ) 为 X 的 并且称\sqrt {Var(X)}为X的 Var(X) X标准差 或 均方差

【注意】:方差是用来描述随机变量取值相对于均值的离散程度的一个量,是非常重要的数字特征。
【方差的性质】:

  • 若 c 是 常 数 , 则 V a r ( c ) = 0 若c是常数,则Var(c)=0 cVar(c)=0
  • V a r ( a X + b ) = a 2 E ( X ) , 其 中 a , b 是 任 意 常 数 ; Var(aX+b)=a^2E(X),其中a,b是任意常数; Var(aX+b)=a2E(X),a,b;
  • 若 X , Y 相 互 独 立 , 则 V a r ( X + Y ) = V a r ( X ) + V a r ( Y ) ; 若X,Y相互独立,则Var(X+Y)=Var(X)+Var(Y); X,YVar(X+Y)=Var(X)+Var(Y);
  1. 协方差:
    协方差相关系数 都 是 描 述 随 机 变 量 X 与 随 机 变 量 Y 之 间 的 线 性 联 系 程 度 的 数 字 量 。 都是描述随机变量X与随机变量Y之间的线性联系程度的数字量。 XY线

设 X , Y 为 两 个 随 机 变 量 , 称 E { [ X − E ( X ) ] [ Y − E ( Y ) ] } 为 X 和 Y 的 协 方 差 , 记 作 C o v ( X , Y ) , 即 : 设X,Y为两个随机变量,称E\lbrace{[X-E(X)][Y-E(Y)]}\rbrace为X和Y的协方差,记作Cov(X,Y),即: X,YE{[XE(X)][YE(Y)]}XYCov(X,Y),
C o v ( X , Y ) = E { [ X − E ( X ) ] [ Y − E ( Y ) ] } Cov(X,Y)=E\lbrace{[X-E(X)][Y-E(Y)]}\rbrace Cov(X,Y)=E{[XE(X)][YE(Y)]}

【协方差的性质】:

  • C o v ( X , Y ) = C o v ( Y , X ) ; Cov(X,Y)=Cov(Y,X); Cov(X,Y)=Cov(Y,X);
  • C o v ( a X + b , c Y + d ) = a c C o v ( X , Y ) , 其 中 a , b , c , d 为 任 意 常 数 ; Cov(aX+b,cY+d)=acCov(X,Y),其中a,b,c,d为任意常数; Cov(aX+b,cY+d)=acCov(X,Y),a,b,c,d;
  • C o v ( X 1 + X 2 , Y ) = C o v ( X 1 , Y ) + C o v ( X 2 , Y ) ; Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y); Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y);
  • C o v ( X , Y ) = E ( X , Y ) − E ( X ) E ( Y ) ; Cov(X,Y)=E(X,Y)-E(X)E(Y); Cov(X,Y)=E(X,Y)E(X)E(Y);
  • 当 X , Y 相 互 独 立 时 , C o v ( X , Y ) = 0 ; 当X,Y相互独立时,Cov(X,Y)=0; X,YCov(X,Y)=0;
  • ∣ C o v ( X , Y ) ∣ = V a r ( X ) V a r ( Y ) ; |Cov(X,Y)|=\sqrt {Var(X)}\sqrt {Var(Y)}; Cov(X,Y)=Var(X) Var(Y) ;
  • C o v ( X , X ) = V a r ( X ) ; Cov(X,X)=Var(X); Cov(X,X)=Var(X);
  1. 相关系数:
    当 V a r ( X ) > 0 , V a r ( Y ) > 0 时 , 称 : 当\sqrt {Var(X)}>0,\sqrt {Var(Y)}>0时,称: Var(X) >0Var(Y) >0
    ρ ( X , Y ) = C o v ( X , Y ) V a r ( X ) V a r ( Y ) \rho(X,Y)=\frac {Cov(X,Y)}{\sqrt {Var(X)}\sqrt {Var(Y)}} ρ(X,Y)=Var(X) Var(Y) Cov(X,Y)
    为 X , Y 的 相 关 系 数 , 它 是 无 纲 量 的 量 , 也 就 是 没 有 单 位 。 为X,Y的相关系数,它是无纲量的量,也就是没有单位。 X,Y
    【补充】:
    1. 用相关系数来衡量两个变量之间的相关程度。
    2. 相关系数在**-1到1之间,小于0表示负相关**,大于0表示正相关
    3. 绝对值 ∣ ρ ( X , Y ) ∣ |\rho(X,Y)| ρ(X,Y)表示相关度的大小,越接近1,相关度越大。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

哎呦哥哥、

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值