【概率论&统计学】复习笔记

1. 常见术语

Likelihood

南溪:我觉得

  • 概率描述的是物理事件,而likelihood描述的是一个模型,两者依附的主体是不一样的;
  • 似然函数并不是一个概率值,它其实是人类专家设定的一种可能性的评价指标。


Claude-3.5-Sonnet-200k:对,你理解得很深入!似然函数更像是一个“评分卡”,用来对比不同参数假设的相对合理性,而不是真实的概率值。

2. 符号和公式

N ( μ , σ 2 ) \mathcal{N}(\mu,\sigma^2) N(μ,σ2):正态分布, μ \mu μ指正态分布的均值, σ 2 \sigma^2 σ2是正态分布的方差

(这里的符号 N \mathcal{N} N是大写字母N的手写体,具体可以参考这篇博文《LaTeX 各种命令,符号汇总(全)》,其中写到,
在这里插入图片描述

p ( ω j , x ) p\left ( \omega _{j},x \right ) p(ωj,x):联合概率密度函数。指 ω j \omega _{j} ωj和x同时发生的概率密度。

2. 概率分布

2.1 PDF和PMF可以统称为概率分布

2.2 常见概率分布

Multivariate Normal Distribution 多元正态分布

设:

  • x = [ x 1 , x 2 , … , x n ] T \mathbf{x} = [x_1, x_2, \dots, x_n]^T x=[x1,x2,,xn]T为变量向量,
  • μ = [ μ 1 , μ 2 , … , μ n ] T \boldsymbol{\mu} = [\mu_1, \mu_2, \dots, \mu_n]^T μ=[μ1,μ2,,μn]T 为均值向量,
  • Σ \Sigma Σ为协方差矩阵(描述变量间的相关性)。

多元正态分布的PDF为
f ( x ) = 1 ( 2 π ) n ∣ Σ ∣ exp ⁡ ( − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) ) f(\mathbf{x}) = \frac{1}{\sqrt{(2\pi)^{n} |\Sigma|}} \exp\left( -\frac{1}{2} (\mathbf{x} - \boldsymbol{\mu})^T \Sigma^{-1} (\mathbf{x} - \boldsymbol{\mu})\right) f(x)=(2π)n∣Σ∣ 1exp(21(xμ)TΣ1(xμ))

南溪:这里的上标 T T T表示的是矩阵的“转置”(Transpose)运算。

3. 期望

3.1 全期望公式

E [ X ] = E [ E [ X ∣ Y ] ] E[X] = E[E[X \mid Y]] E[X]=E[E[XY]]

3.1.1 条件概率的等效形式

E X [ X ] = E Y [ E X ∼ p ( X ∣ Y ) [ X ∣ Y ] ] E_{X}[X] = E_{Y}[E_{X\sim p(X \mid Y)}[X \mid Y]] EX[X]=EY[EXp(XY)[XY]]

3. 采样

3.1 Importance Sampling:“从A采样估计B分布”

E x ∼ p ( x ) [ f ( x ) ] = ∫ p ( x ) f ( x ) d x = ∫ q ( x ) q ( x ) p ( x ) f ( x ) d x = ∫ q ( x ) p ( x ) q ( x ) f ( x ) d x = E x ∼ q ( x ) [ p ( x ) q ( x ) f ( x ) ] \begin{aligned} E_{x\thicksim p(x)}[f(x)] & =\int p(x)f(x)dx \\ & =\int\frac{q(x)}{q(x)}p(x)f(x)dx \\ & =\int q(x)\frac{p(x)}{q(x)}f(x)dx \\ & =E_{x\sim q(x)}\left[\frac{p(x)}{q(x)}f(x)\right] \end{aligned} Exp(x)[f(x)]=p(x)f(x)dx=q(x)q(x)p(x)f(x)dx=q(x)q(x)p(x)f(x)dx=Exq(x)[q(x)p(x)f(x)]

简单比喻:(from Gemini2.0-Flash-Thinking-ai)
“想象一下你要统计一个学校学生的平均身高(期望值)。 但是你不能直接接触到所有学生 (无法从目标分布p采样),只能接触到学校篮球队的队员(只能从另一个分布q采样,篮球队员身高分布和全校学生身高分布不同)。重要性采样就像一种加权平均的方法,你统计篮球队员的平均身高,但同时根据篮球队员身高分布和全校学生身高分布的差异,给每个篮球队员的身高赋予不同的权重,从而近似估计出全校学生的平均身高。”

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值