3.1 概率与分布

最新推荐文章于 2025-12-27 16:51:58 发布

原创最新推荐文章于 2025-12-27 16:51:58 发布 · 195 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#概率论 #人工智能 #深度学习

数学基础知识专栏收录该内容

25 篇文章

订阅专栏

第三章概率统计

全文均为手敲，如果发现有误，请于评论区交流讨论留言，作者会及时修改

3.1 概率与分布

事件及其运算

和事件： $A+B=A∪BA+B=A\cup B$

积事件： $AB=A∩BAB=A\cap B$

差事件： $A−B=A∩B‾A-B=A\cap\overline{B}$
事件的概率及其运算

$A$ 与 $B$ 对立（ $B=A‾B=\overline{A}$ ）： $P (A + B) = P (A) + P (B) = 1, P (A B) = 0$

$A$ 与 $B$ 互斥（互不相容）： $P (A + B) = P (A) + P (B), P (A B) = 0$

$A$ 与 $B$ 独立： $P(A)=P(A∣B)=P(A∣B‾),P(AB)=P(A)P(B)P(A)=P(A|B)=P(A|\overline{B}),P(AB)=P(A)P(B)$
概率模型

古典概型、几何概型：强调概率相等性。
概率的加法公式（容斥原理）

两个事件： $P (A + B) = P (A) + P (B) - P (A B)$

三个事件： $P (A + B + C) = P (A) + P (B) + P (C) - P (A B) - P (BC) - P (C A) + P (A BC)$
条件概率

若事件 $B$ 的概率非零，则在 $B$ 发生的条件下， $A$ 发生的概率称为条件概率，记作

$P(A∣B)=P(AB)P(B)P(A|B)=\frac{P(AB)}{P(B)}$
乘法公式

若 $P (B) > 0$ ，则 $P (A B) = P (B) P (A ∣ B)$

若 $P(A1⋯An−1)>0P(A_1\cdots A_{n-1})>0$ ，则 $P(A1⋯An)=P(A1)P(A2∣A1)⋯P(An∣A1⋯An−1)P(A_1\cdots A_n)=P(A_1)P(A_2|A_1)\cdots P(A_n|A_1\cdots A_{n-1})$
全概率公式

若事件 $,BnB_1,\cdots,B_n$ 是样本空间或全事件集的一组划分，且 $P(B_i)>0$ ，则

$P(A)=∑i=1nP(ABi)=∑i=1nP(Bi)P(A∣Bi)P(A)=\sum_{i=1}^nP(AB_i)=\sum_{i=1}^nP(B_i)P(A|B_i)$

特别地

$P(A)=P(B)P(A∣B)+P(B‾)P(A∣B‾)P(A)=P(B)P(A|B)+P(\overline{B})P(A|\overline{B})$
贝叶斯公式

若事件 $,BnB_1,\cdots,B_n$ 是样本空间或全事件集的一组划分，且 $P(B_i)>0,P(A)>0$ ，则

$P(Bi∣A)=P(ABi)P(A)=P(Bi)P(A∣Bi)∑j=1nP(Bj)P(A∣Bj)P(B_i|A)=\frac{P(AB_i)}{P(A)}=\frac{P(B_i)P(A|B_i)}{\sum\limits_{j=1}^nP(B_j)P(A|B_j)}$

更在意后验概率、关注前提条件的思维模式
随机变量的分布函数

给定随机变量 $X$ ，对任意实数 $x$ ，定义随机变量 $X$ 的分布函数为： $F(x)=P(X≤x)F(x)=P(X\le x)$

分布函数的基本性质：

$(1)$ 单调不减， $F(x+t)≥F(x),∀t>0F(x+t)\ge F(x),\forall t>0$

$(2)$ 有界， $0≤F(x)≤1,F(−∞)=0,F(+∞)=10\le F(x)\le1,F(-\infty)=0,F(+\infty)=1$

$(3)$ 右连续， $lim⁡t→0+F(x+t)=F(x)\lim\limits_{t\to 0^+}F(x+t)=F(x)$

$(4)P(a<x≤b)=F(b)−F(a)(4)P(a<x\le b)=F(b)-F(a)$
离散随机变量的分布列（分布律）

设离散随机变量 $X$ 的可能取值为： $,xn,⋯x_1,x_2,\cdots,x_n,\cdots$ ，则称 $pi=P(X=xi),i=1,2,⋯p_i=P(X=x_i),i=1,2,\cdots$ 为 $X$ 的分布列

满足非负性 $pi≥0p_i\ge0$ 和正则性 $∑pi=1\sum p_i=1$ （或称为概率的归一化条件）
连续随机变量的概率密度函数

设随机变量 $X$ 的分布函数为 $F (x)$ ，若存在非负可积函数 $p (x)$ ，使得 $F(x)=∫−∞xp(x)dxF(x)=\int_{-\infty}^xp(x)dx$ ，则

称 $X$ 是连续随机变量，称 $p (x)$ 为概率密度函数，简称密度函数。

满足非负性 $p(x)≥0p(x)\ge0$ 和正则性 $∫−∞+∞p(x)dx=1\int_{-\infty}^{+\infty}p(x)dx=1$ （或称为概率的归一化条件）

对于连续随机变量， $P (X = x) = 0$ ，其概率密度函数可以定义为

$p(x)={F′(x),F在x处可导0,F在x处不可导p(x)=\begin{cases}F'(x),&F在x处可导\\0,&F在x处不可导\end{cases}$

特别地， $F$ 处的不可导点处的 $p (x)$ 也可以定义为其他有限值，因为不改变 $p (x)$ 的积分值
离散随机变量的数学期望

设离散随机变量 $X$ 的分布列为 $P(X=xn)=pn,n=1,2,⋯P(X=x_n)=p_n,n=1,2,\cdots$ ，若级数 $∑i=1∞xipi\sum\limits_{i=1}^{\infty}x_ip_i$ 绝对收敛，则称该级数为 $X$ 的数学期望，记为

$E(X)=∑i=1∞xipiE(X)=\sum\limits_{i=1}^{\infty}x_ip_i$
连续变量的数学期望

设连续随机变量 $X$ 的密度函数为 $p (x)$ ，若积分 $∫−∞+∞xp(x)dx\int_{-\infty}^{+\infty}xp(x)dx$ 绝对收敛，则称该积分为 $X$ 的数学期望，记为

$E(X)=∫−∞+∞xp(x)dxE(X)=\int_{-\infty}^{+\infty}xp(x)dx$
随机变量函数的期望

设 $Y = g (X)$ 是随机变量 $X$ 的函数，若 $E (g (X))$ 存在，则

$E(g(X))=∑i=1∞g(xi)P(X=xi)或者E(g(X))=∫−∞+∞g(x)p(x)dxE(g(X))=\sum_{i=1}^\infty g(x_i)P(X=x_i)或者E(g(X))=\int_{-\infty}^{+\infty}g(x)p(x)dx$
数学期望的性质

$(1)E(c)=c(2)E(aX)=aE(X)(3)E(g1(X)+g2(X))=E(g1(X))+E(g2(X))\begin{aligned} (1)&E(c)=c\\ (2)&E(aX)=aE(X)\\ (3)&E(g_1(X)+g_2(X))=E(g_1(X))+E(g_2(X)) \end{aligned}$

第三条性质意味着——独立性不影响随机变量和的期望展开计算
随机变量的方差

给定随机变量 $X$ ，若 $E(X-E(X))^2$ 存在，则称 $E(X-E(X))^2$ 为 $X$ 的方差，记为

$Var(X)=D(X)=E(X-E(X))^2$

方差具有如下性质

$(1)Var(X)=E(X2)−[E(X)]2(2)Var(c)=0(3)Var(aX+b)=a2Var(X)\begin{aligned} (1)&Var(X)=E(X^2)-[E(X)]^2\\ (2)&Var(c)=0\\ (3)&Var(aX+b)=a^2Var(X) \end{aligned}$
随机变量的标准化

设 $Va r (X) > 0$ ，令

$Y=X−EXVar(X)Y=\frac{X-EX}{\sqrt{Var(X)}}$

则有 $E (Y) = 0, Va r (Y) = 1$ ，称 $Y$ 为 $X$ 的标准化。
二项分布

$n$ 重伯努利试验中成功的次数记作 $X$ ，则 $X$ 满足分布律：

$,nP(X=k)=\begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k},k=0,1,\cdots,n$

记作 $X∼B(n,p)X\sim B(n,p)$ ，其期望和方差分别为： $E (X) = n p, Va r (X) = n p (1 - p)$
泊松分布

若随机变量 $X$ 的分布律满足：

$P(X=k)=λkk!e−λ,k=0,1,2,⋯P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda},k=0,1,2,\cdots$

则称 $X$ 服从参数为 $λ\lambda$ 的泊松分布，记为 $X∼P(λ)X\sim P(\lambda)$ ，其期望和方差分别为： $E(X)=λ,Var(X)=λE(X)=\lambda,Var(X)=\lambda$
超几何分布

$N$ 个产品中有 $M$ 个不合格品，从中抽取 $n$ 个，不合格品的个数为 $X$ ，则 $X$ 满足分布律：

$P(X=k)=(Mk)(N−Mn−k)(Nn)P(X=k)=\frac{\begin{pmatrix}M\\k\end{pmatrix}\begin{pmatrix}N-M\\n-k\end{pmatrix}}{\begin{pmatrix}N\\n\end{pmatrix}}$

记作 $X∼h(n,N,M)X\sim h(n,N,M)$
几何分布

若随机变量 $X$ 为独立重复伯努利试验中首次成功时的试验次数，则 $X$ 满足分布律：

$P(X=k)=(1−p)k−1p,k=1,2,⋯P(X=k)=(1-p)^{k-1}p,k=1,2,\cdots$

记作 $X∼Ge(p)X\sim Ge(p)$ ，其期望和方差分别为： $E(X)=1/p,Var(X)=(1-p)/p^2$

几何分布具有无记忆性，即

$P (X > m + n ∣ X > m) = P (X > n)$
负二项分布

若随机变量 $X$ 为独立重复伯努利试验中第 $r$ 次成功时的试验次数，则 $X$ 满足分布律：

$P(X=k)=(k−1r−1)(1−p)k−rpr,k=r,r+1,⋯P(X=k)=\begin{pmatrix}k-1\\r-1\end{pmatrix}(1-p)^{k-r}p^r,k=r,r+1,\cdots$

记为 $X∼Nb(r,p)X\sim Nb(r,p)$

可以表示成 $r$ 个独立同分布几何分布随机变量之和
正态分布

若随机变量 $X$ 的概率密度函数为

$p(x)=12πσexp{−(x−μ)22σ2}p(x)=\frac{1}{\sqrt{2\pi}\sigma}exp\{-\frac{(x-\mu)^2}{2\sigma^2}\}$

记作 $X∼N(μ,σ2)X\sim N(\mu,\sigma^2)$ ，其期望和方差分别为： $E(X)=μ,Var(X)=σ2E(X)=\mu,Var(X)=\sigma^2$
标准正态分布

若 $X∼N(0,1)X\sim N(0,1)$ ，则称 $X$ 服从标准正态分布，其密度函数记为 $φ(x)\varphi(x)$ ，分布函数记为 $Φ(x)\Phi(x)$

标准正态分布函数满足： $Φ(0)=1/2,Φ(−x)=1−Φ(x)\Phi(0)=1/2,\Phi(-x)=1-\Phi(x)$ 。

若 $P(X≤zα)=Φ(zα)=αP(X\le z_\alpha)=\Phi(z_\alpha)=\alpha$ ，则称 $zαz_\alpha$ 为标准正态分布的 $α\alpha$ 分位点
一般正态分布的标准化

若 $X∼N(μ,σ2)X\sim N(\mu,\sigma^2)$ ，则

$X−μσ∼N(0,1),F(x)=Φ(x−μσ)\frac{X-\mu}\sigma\sim N(0,1),F(x)=\Phi(\frac{x-\mu}\sigma)$
均匀分布

若随机变量的概率密度函数满足

$p(x)={1/(b−a),a<x<b0,otherwisep(x)=\begin{cases}1/(b-a),&a<x<b\\0,&otherwise\end{cases}$

则称 $X$ 服从均匀分布，记作 $X∼U(a,b)X\sim U(a,b)$

其期望和方差分别为 $E(X)=(a+b)/2,Var(X)={(b-a)^2}/{12}$
指数分布

若随机变量的概率密度函数满足

$p(x)={λe−λx,x>00,x≤0p(x)=\begin{cases}\lambda e^{-\lambda x},&x>0\\0,&x\le 0\end{cases}$

则称 $X$ 服从指数分布，记作 $X∼Exp(λ),λ>0X\sim Exp(\lambda),\lambda>0$

其期望和方差分别为： $E(X)=1/λ,Var(X)=1/λ2E(X)=1/\lambda,Var(X)=1/{\lambda^2}$
$Γ\Gamma$ 分布

若随机变量的概率密度函数满足

$p(x)=λαΓ(α)xα−1e−λx,x≥0p(x)=\frac{\lambda^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\lambda x},x\ge0$

则称 $X$ 服从 $Γ\Gamma$ 分布，记作 $X∼Ga(α,λ),α>0,λ>0X\sim Ga(\alpha,\lambda),\alpha>0,\lambda>0$

其期望为 $E(X)=α/λE(X)=\alpha/\lambda$

称 $Γ(α)=∫0+∞xα−1e−xdx\Gamma(\alpha)=\int_0^{+\infty}x^{\alpha-1}e^{-x}dx$ 为 $Γ\Gamma$ 函数

一些性质

$(1)Γ(1)=1,Γ(12)=π,Γ(n+1)=n!(2)Ga(1,λ)=Exp(λ),Ga(n2,12)=χ2(n)(3)X∼Ga(α,λ)⇒kX∼Ga(α,λ/k)(k>0)\begin{aligned} &(1)\Gamma(1)=1,\Gamma(\frac 12)=\sqrt\pi,\Gamma(n+1)=n!\\ &(2)Ga(1,\lambda)=Exp(\lambda),Ga(\frac n2,\frac 12)=\chi^2(n)\\ &(3)X\sim Ga(\alpha,\lambda)\Rightarrow kX\sim Ga(\alpha,\lambda/k)(k>0) \end{aligned}$
$B e t a$ 分布

若随机变量的概率密度函数满足

$p(x)=1B(a,b)xa−1(1−x)b−1,0<x<1p(x)=\frac{1}{B(a,b)}x^{a-1}(1-x)^{b-1},0<x<1$

则称 $X$ 服从 $B e t a$ 分布，记作 $X∼Be(a,b),a>0,b>0X\sim Be(a,b),a>0,b>0$

其期望为 $E (X) = a / (a + b)$

称 $B(a,b)=∫01xa−1(1−x)b−1dxB(a,b)=\int_0^1x^{a-1}(1-x)^{b-1}dx$ 为 $B e t a$ 函数

一些性质

$(1)B(a,b)=B(b,a)(2)B(a,b)=Γ(a)Γ(b)Γ(a+b)(3)Be(1,1)=U(0,1)\begin{aligned} (1)&B(a,b)=B(b,a)\\ (2)&B(a,b)=\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}\\ (3)&Be(1,1)=U(0,1) \end{aligned}$
离散随机变量函数的分布

当 $X$ 为离散随机变量时， $Y = g (X)$ 为离散随机变量

将 $g(x_i)$ 一一列出，再将相等的值合并即可
连续随机变量函数的分布

设 $X$ 的概率密度函数为 $p_X(x)$ ， $y = g (x)$ 是 $x$ 的严格单调函数，且值域为 $(a, b)$ ，则 $y = g (x)$ 存在反函数 $x = h (y)$ ，且 $h (y)$ 连续可导，则 $Y = g (X)$ 的密度函数为

$pY(y)={pX(h(y))∣h′(y)∣,a<y<b0,otherwisep_Y(y)=\begin{cases}p_X(h(y))|h'(y)|,&a<y<b\\0,&otherwise\end{cases}$
正态变量的线性不变性

设 $X∼N(μ,σ2),a≠0X\sim N(\mu,\sigma^2),a\ne0$ ，则 $aX+b∼N(aμ+b,a2σ2)aX+b\sim N(a\mu+b,a^2\sigma^2)$
各种分布随机数的产生

若随机变量 $X$ 的分布函数为 $F_X(x)$ ，若 $F_X(x)$ 连续且严格单调递增，则 $Y=FX(x)∼U(0,1)Y=F_X(x)\sim U(0,1)$
$k$ 阶原点矩和中心距

$k$ 阶原点矩： $μk=E(Xk)\mu_k=E(X^k)$

$k$ 阶中心矩： $v_k=E[X-E(X)]^k$
变异系数

称 $CV=VarX/E(X)C_V=\sqrt{Var{X}}/E(X)$ 为 $X$ 的变异系数
偏度系数

设随机变量 $X$ 的前三阶矩存在，则比值

$βS=v3v232=E(X−EX)3[Var(X)]32\beta_S=\frac{v_3}{v_2^{\frac 32}}=\frac{E(X-EX)^3}{[Var(X)]^{\frac 32}}$
峰度系数

设随机变量 $X$ 的前四阶矩存在，则比值

$βk=v4v22−3=E(X−EX)4[Var(X)]2−3\beta_k=\frac{v_4}{v_2^2}-3=\frac{E(X-EX)^4}{[Var(X)]^2}-3$
二维随机变量的联合分布

给定随机变量 $X$ 和 $Y$ ，对任意实数 $x$ 和 $y$ ，称 $F(x,y)=P(X≤x,Y≤y)F(x,y)=P(X\le x,Y\le y)$ 为 $(X, Y)$ 的联合分布函数

联合分布函数的性质

$(1)F(x,y)关于x和y分别单调不减(2)0≤F(x,y)≤1,F(−∞,y)=F(x,−∞)=0,F(+∞,+∞)=1(3)F(x,y)关于x和y分别右连续(4)P(a<X≤b,c<Y≤d)=F(b,d)−D(b,c)−F(a,d)+F(a,c)≥0\begin{aligned} (1)&F(x,y)关于x和y分别单调不减\\ (2)&0\le F(x,y)\le 1,F(-\infty,y)=F(x,-\infty)=0,F(+\infty,+\infty)=1\\ (3)&F(x,y)关于x和y分别右连续\\ (4)&P(a<X\le b,c<Y\le d)=F(b,d)-D(b,c)-F(a,d)+F(a,c)\ge 0 \end{aligned}$
二维离散随机变量

若 $(X, Y)$ 的可能取值为可列对，则称 $(X, Y)$ 为二维离散随机变量，其分布列（分布律）为：

$pij=P(X=xi,Y=yj)i,j=1,2,⋯p_{ij}=P(X=x_i,Y=y_j)\quad i,j=1,2,\cdots$

所有的 $p_{ij}$ 满足非负性和归一化
二维连续随机变量

设二维随机变量 $(X, Y)$ 的分布函数为 $F (x, y)$ ，若存在非负可积函数 $p (x, y)$ ，使得

$F(x,y)=∫−∞x∫−∞yp(u,v)dudvF(x,y)=\int_{-\infty}^x\int_{-\infty}^yp(u,v)dudv$

则称 $(X, Y)$ 为二维连续随机变量，称 $p (x, y)$ 为联合概率密度，满足非负性和归一化

特别地

$P{(X,Y)∈D}=∬Dp(x,y)dxdyP\{(X,Y)\in D\}=\iint\limits_Dp(x,y)dxdy$
边缘分布函数（边际分布函数）

已知 $(X, Y)$ 的联合分布函数为 $F (x, y)$ ，则

$X$ 的（边缘）分布函数为： $FX(x)=F(x,+∞)F_X(x)=F(x,+\infty)$

$Y$ 的（边缘）分布函数为： $FY(y)=F(+∞,y)F_Y(y)=F(+\infty,y)$
边缘分布律（边际分布列）

已知 $(X, Y)$ 的联合分布律为 $p_{ij}=P(X=x_i,Y=y_j)$

$X$ 的（边缘）分布律为： $pi=P(X=xi)=∑j=1∞pij=pi⋅p_i=P(X=x_i)=\sum\limits_{j=1}^\infty p_{ij}=p_{i\cdot}$

$Y$ 的（边缘）分布律为： $pj=P(Y=yj)=∑i=1∞pij=p⋅jp_j=P(Y=y_j)=\sum\limits_{i=1}^\infty p_{ij}=p_{\cdot j}$
边缘密度函数（边际密度函数）

已知 $(X, Y)$ 的联合密度函数为 $p (x, y)$ ，则

$X$ 的（边缘）密度函数为： $pX(x)=∫−∞+∞p(x,y)dyp_X(x)=\int_{-\infty}^{+\infty}p(x,y)dy$

$Y$ 的（边缘）密度函数为： $pY(y)=∫−∞+∞p(x,y)dxp_Y(y)=\int_{-\infty}^{+\infty}p(x,y)dx$
随机变量的独立性

若随机变量 $X$ 和 $Y$ 满足以下之一

$(1)F(x,y)=FX(x)FY(y)(2)pij=pipj(3)p(x,y)=pX(x)pY(y)\begin{aligned} (1)&F(x,y)=F_X(x)F_Y(y)\\ (2)&p_{ij}=p_ip_j\\ (3)&p(x,y)=p_X(x)p_Y(y) \end{aligned}$

则称 $X$ 与 $Y$ 是独立的

$X$ 与 $Y$ 独立的本质应该回到概率的定义上：对任意实数 $a, b, c, d$ 有

$P (a < X < b, c < Y < d) = P (a < X < b) P (c < Y < d)$

若 $X$ 与 $Y$ 是独立的，则 $g (X)$ 与 $h (Y)$ 也是独立的
多维随机变量函数的分布

已知 $(X, Y)$ 的联合分布函数为 $F (x, y)$ ，若 $Z=max⁡(X,Y)Z=\max(X,Y)$ ，则

$FZ(z)=P(max⁡(X,Y)≤z)=P(X≤z且Y≤z)=F(z,z)\begin{aligned} F_Z(z)&=P(\max(X,Y)\le z)\\ &=P(X\le z且Y\le z)\\ &=F(z,z) \end{aligned}$

若 $Z=min⁡(X,Y)Z=\min(X,Y)$ ，则

$FZ(z)=P(min⁡(X,Y)≤z)=P(X≤z或Y≤z)=1−P(X>z,Y>z)=F(+∞,z)+F(z,+∞)−F(z,z)\begin{aligned} F_Z(z)&=P(\min(X,Y)\le z)\\ &=P(X\le z或Y\le z)\\ &=1-P(X>z,Y>z)\\ &=F(+\infty,z)+F(z,+\infty)-F(z,z) \end{aligned}$

$Z$ 的概率密度为 $p_Z(z)=F_Z'(z)$
连续场合的卷积公式

设连续随机变量 $X$ 与 $Y$ 独立，则 $Z = X + Y$ 的密度函数为

$pZ(z)=∫−∞+∞pX(x)pY(z−x)dx=∫−∞+∞pX(z−y)pY(y)dy\begin{aligned}p_Z(z)&=\int_{-\infty}^{+\infty}p_X(x)p_Y(z-x)dx\\ &=\int_{-\infty}^{+\infty}p_X(z-y)p_Y(y)dy \end{aligned}$
离散场合的卷积公式

设离散随机变量 $X$ 与 $Y$ 独立，则 $Z = X + Y$ 的分布列为

$P(Z=zl)=∑i=1∞P(X=xi)P(Y=zl−xi)=∑j=1∞P(X=zl−yj)P(Y=yj)\begin{aligned} P(Z=z_l)&=\sum_{i=1}^\infty P(X=x_i)P(Y=z_l-x_i)\\ &=\sum_{j=1}^\infty P(X=z_l-y_j)P(Y=y_j) \end{aligned}$
二项分布的可加性

若 $X∼B(n1,p),Y∼B(n2,p)X\sim B(n_1,p),Y\sim B(n_2,p)$ ，且独立，则 $Z=X+Y∼B(n1+n2,p)Z=X+Y\sim B(n_1+n_2,p)$
泊松分布的可加性

若 $X∼P(λ1),Y∼P(λ2)X\sim P(\lambda_1),Y\sim P(\lambda_2)$ ，且独立，则 $Z=X+Y∼P(λ1+λ2)Z=X+Y\sim P(\lambda_1+\lambda_2)$
正态分布的可加性

若 $,nX_i\sim N(\mu_i,\sigma_i^2),i=1,2,\cdots,n$ ，且 $X_i$ 间相互独立，实数 $,ana_1,\cdots,a_n$ 不全为零，则

$∑i=1naiXi+bi∼N(∑i=1naiμi+bi,∑i=1nai2σi2)\sum_{i=1}^na_iX_i+b_i\sim N(\sum_{i=1}^na_i\mu_i+b_i,\sum_{i=1}^na_i^2\sigma_i^2)$
$Γ\Gamma$ 分布的可加性

若 $X∼Ga(α1,λ),Y∼Ga(α2,λ)X\sim Ga(\alpha_1,\lambda),Y\sim Ga(\alpha_2,\lambda)$ ，且独立，则 $Z=X+Y∼Ga(α1+α2,λ)Z=X+Y\sim Ga(\alpha_1+\alpha_2,\lambda)$
$χ2\chi^2$ 分布的可加性

若 $X∼χ2(n1),Y∼χ2(n2)X\sim \chi^2(n_1),Y\sim\chi^2(n_2)$ ，且独立，则 $Z=X+Y∼χ2(n1+n2)Z=X+Y\sim\chi^2(n_1+n_2)$
多维随机变量的数学期望

设 $(X, Y)$ 是二维随机变量， $Z = g (X, Y)$ ，则

$E(Z)=E[g(X,Y)]=∑i∑jg(xi,yj)pij,(X,Y)离散或者=∫−∞+∞∫−∞+∞g(x,y)p(x,y)dxdy,(X,Y)连续\begin{aligned}E(Z)=E[g(X,Y)]&= \sum_i\sum_jg(x_i,y_j)p_{ij},&(X,Y)离散\\ 或者&=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x,y)p(x,y)dxdy,&(X,Y)连续 \end{aligned}$

一些性质

$(1)E(X+Y)=E(X)+E(Y)(2)若X与Y独立,则E(XY)=E(X)E(Y)\begin{aligned} (1)&E(X+Y)=E(X)+E(Y)\\ (2)&若X与Y独立,则E(XY)=E(X)E(Y) \end{aligned}$
方差展开式

$(1)Var(X±Y)=Var(X)+Var(Y)±2E[X−E(X)][Y−E(Y)](2)E[X−E(X)][Y−E(Y)]=E(XY)−E(X)E(Y)(3)当X与Y独立时,E[X−E(X)][Y−E(Y)]=0(4)当X与Y独立时,Var(X±Y)=Var(X)+Var(Y)\begin{aligned} (1)&Var(X\pm Y)=Var(X)+Var(Y)\pm 2E[X-E(X)][Y-E(Y)]\\ (2)&E[X-E(X)][Y-E(Y)]=E(XY)-E(X)E(Y)\\ (3)&当X与Y独立时,E[X-E(X)][Y-E(Y)]=0\\ (4)&当X与Y独立时,Var(X\pm Y)=Var(X)+Var(Y) \end{aligned}$
协方差与相关系数

定义 $C o v (X, Y) = E [X - E (X)] [Y - E (Y)]$ 为 $X$ 与 $Y$ 的协方差

一些其他性质

$(1)Cov(X,Y)=Cov(Y,X)(2)Cov(X,a)=0(3)Cov(aX,bY)=abCov(X,Y)(4)Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z)(5)Cov(X,X)=Var(X)\begin{aligned} (1)&Cov(X,Y)=Cov(Y,X)\\ (2)&Cov(X,a)=0\\ (3)&Cov(aX,bY)=abCov(X,Y)\\ (4)&Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z)\\ (5)&Cov(X,X)=Var(X) \end{aligned}$

定义以下这个式子为 $X$ 与 $Y$ 的相关系数：

$Corr(X,Y)=Cov(X,Y)Var(X)Var(Y)Corr(X,Y)=\frac{Cov(X,Y)}{\sqrt{Var(X)}\sqrt{Var(Y)}}$

若 $C orr (X, Y) = 0$ ，则称 $X$ 与 $Y$ 不相关
二维正态分布的特征数

若 $(X,Y)∼N(μ1,μ2,σ12,σ22,ρ)(X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$ ，则

$(1)X∼N(μ1,σ12),Y∼N(μ2,σ22)(2)参数ρ为X与Y的相关系数(3)X,Y独立⇔ρ=0(4)不相关与独立等价\begin{aligned} (1)&X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)\\ (2)&参数\rho为X与Y的相关系数\\ (3)&X,Y独立\Leftrightarrow\rho=0\\ (4)&不相关与独立等价 \end{aligned}$
协方差矩阵

记 $X=[X1⋯Xn]T\boldsymbol{X}=\begin{bmatrix}X_1&\cdots&X_n\end{bmatrix}^T$ ，则 $EX=[EX1⋯EXn]TE\boldsymbol{X}=\begin{bmatrix}EX_1&\cdots&EX_n\end{bmatrix}^T$ ，称

$Cov(X)=[Cov(X1,X1)⋯Cov(X1,Xn)⋮⋱⋮Cov(Xn,X1)⋯Cov(Xn,Xn)]Cov(\boldsymbol{X})=\begin{bmatrix}Cov(X_1,X_1)&\cdots&Cov(X_1,X_n)\\ \vdots&\ddots&\vdots\\ Cov(X_n,X_1)&\cdots&Cov(X_n,X_n)\end{bmatrix}$

为 $X\boldsymbol{X}$ 的协方差矩阵，记为 $Cov(X)Cov(\boldsymbol{X})$ ，或 $Σ\boldsymbol{\Sigma}$ ，是一个实对称半正定矩阵。
多元正态分布

设 $n$ 维随机变量 $X\boldsymbol{X}$ 的协方差矩阵为 $Σ=Cov(X)\boldsymbol{\Sigma}=Cov(\boldsymbol{X})$ ，数学期望 $EX=μE\boldsymbol{X}=\boldsymbol{\mu}$ ，若 $n$ 维概率密度为

$,xn)=p(x)=(2π)−n2∣Σ∣−12exp{−12(x−μ)TΣ−1(x−μ)}p(x_1,\cdots,x_n)=p(\boldsymbol{x})=(2\pi)^{-\frac n2}|\boldsymbol{\Sigma}|^{-\frac 12}exp\{-\frac 12(\boldsymbol{x}-\boldsymbol{\mu})^T\boldsymbol{\Sigma}^{-1}(\boldsymbol{x}-\boldsymbol{\mu})\}$

则称 $X\boldsymbol{X}$ 满足 $n$ 元正态分布，记作 $X∼N(μ,Σ)\boldsymbol{X}\sim N(\boldsymbol{\mu},\boldsymbol{\Sigma})$
相关矩阵

称 $X\boldsymbol{X}$ 的相关矩阵为

$R=[ρ11⋯ρ1n⋮⋱⋮ρn1⋯ρnn]R=\begin{bmatrix}\rho_{11}&\cdots&\rho_{1n}\\\vdots&\ddots&\vdots\\\rho_{n1}&\cdots&\rho_{nn}\end{bmatrix}$
条件分布

条件分布列： $pi∣j=P(X=xi∣Y=−yj)=pij/p⋅jp_{i|j}=P(X=x_i|Y=-y_j)=p_{ij}/p_{\cdot j}$

条件密度函数： $p (x ∣ y) = p (x, y) / p (y)$
条件分布函数

$F(x∣y)=P(X≤x∣Y=y)=∑xi≤xP(X=xi∣Y=y)X离散或者=∫−∞xp(t∣y)dtX连续\begin{aligned} F(x|y)=P(X\le x|Y=y)&=\sum_{x_i\le x}P(X=x_i|Y=y)&X离散\\ 或者&=\int_{-\infty}^xp(t|y)dt&X连续 \end{aligned}$
条件数学期望

$E(X∣Y=y)=∑ixiP(X=xi∣Y=y)X离散或者=∫−∞+∞xp(x∣y)dxX连续\begin{aligned} E(X|Y=y)&=\sum_ix_iP(X=x_i|Y=y)&X离散\\ 或者&=\int_{-\infty}^{+\infty}xp(x|y)dx&X连续 \end{aligned}$

注意： $E (X ∣ Y = y)$ 是 $y$ 的函数
重期望公式

$E (X) = E (E (X ∣ Y))$