一些机器学习相关的数学知识

本文介绍了概率论中的基本概念,如频率与概率的区别,条件概率的定义及其乘法公式,以及全概率和贝叶斯公式。还讨论了独立事件、大数定理和中心极限定理的意义,并提到了几种重要的概率分布,包括伯努利、二项、多项和高斯分布,以及马尔可夫链的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

概率论

1、频率与概率的区别

2、条件概率:
P(A∣B)=P(AB)P(B) P(A|B)=\frac{P(AB)}{P(B)} P(AB)=P(B)P(AB)

P(AB)表示A、B同时发生的概率

3、乘法公式(由条件概率推导):
P(AB)=P(A∣B)P(B) P(AB)=P(A|B)P(B) P(AB)=P(AB)P(B)

更一般的有:
P(ABC...Z)=P(A∣BC...Z)P(B∣C...Z)P(C∣D...Z)...P(Y∣Z)P(Z) P(ABC...Z)=P(A|BC...Z)P(B|C...Z)P(C|D...Z)...P(Y|Z)P(Z) P(ABC...Z)=P(ABC...Z)P(BC...Z)P(CD...Z)...P(YZ)P(Z)

条件概率的乘法公式:
P(AB∣C)=P(A∣BC)P(B∣C) P(AB|C)=P(A|BC)P(B|C) P(ABC)=P(ABC)P(BC)

证明过程:
P(AB∣C)=P(ABC)/P(C)=P(A∣BC)P(B∣C)P(C)/P(C)=P(A∣BC)P(B∣C) P(AB|C)=P(ABC)/P(C)=P(A|BC)P(B|C)P(C)/P(C)=P(A|BC)P(B|C) P(ABC)=P(ABC)/P(C)=P(ABC)P(BC)P(C)/P(C)=P(ABC)P(BC)

4、P(AUB) = P(A) + P(B) - P(AB)

若A、B无交集,则P(AUB) = P(A) + P(B)

5、全概率

6、贝叶斯公式,已知P(A|B),求P(B|A):

P(B∣A)=P(A∣B)P(B)P(A) P(B|A)=\frac{P(A|B)P(B)}{P(A)} P(BA)=P(A)P(AB)P(B)

7、独立事件
P(AB)=P(A)P(B) P(AB)=P(A)P(B) P(AB)=P(A)P(B)

8、大数定理的实践意义:当重复实验次数足够大时,事件的频率可以代替事件的概率。这被称为频率的稳定性。

9、中心极限定理:在相当一般的条件下,当独立随机变量的个数不断增加时,其和的分布趋于正态分布。实际中,我们所考虑的随机变量可以表示成很多的独立随机变量之和,例如一个城市的耗电量是大量用户耗电量的总和。这就是为什么正态分布在概率论中占有重要地位的一个基本原因。

10、马尔可夫链:在已知“现在”的情况下,“未来”不依赖于“过去”

几个重要概念:初始态,状态转移概率矩阵,终极状态概率预测

伯努利分布(Bernoulli Distribution)

0-1分布,成功为1,失败为0。

概率质量函数为:
f(x)=px(1−p)1−x={pifx=11−pifx=00else f(x)=p^x(1-p)^{1-x}=\left\{ \begin{aligned} p & &if\quad x=1 \\ 1-p & & if\quad x=0 \\ 0 & & else \end{aligned} \right. f(x)=px(1p)1x=p1p0ifx=1ifx=0else

二项分布(Binomial Distribution)

二项分布是n重伯努利试验成功次数的离散概率分布,其典型例子是掷硬币。很显然,伯努利分布是二项分布在n=1时的特例

概率质量函数为:
P(X=k)=Cnkpk(1−p)n−k P(X=k)=C_n^kp^k(1-p)^{n-k} P(X=k)=Cnkpk(1p)nk

X表示成功次数,p为每次成功的概率,n表示n重伯努利试验。

多项分布(Multinomial Distribution)

多项分布是二项分布的推广,二项分布规定每次试验的结果只有两个(0和1),多项分布则允许有多个试验结果,其典型例子是掷骰子。

高斯分布(正态分布)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值