频率派和贝叶斯派

频率派和贝叶斯派是对概率诠释的两大学派。

首先假设有N个样本组成X。每个样本xi是p维向量,每个观测都由p(x|\theta)生成。

一、频率派

频率派认为参数\theta是一个未知常量,X是随机变量,假设xi之间独立同分布(iid independent and identically distributed)【每个随机变量的取值都不依赖于其他随机变量的取值且所有随机变量都服从相同的概率分布】

那么p(X|\theta )=\prod_{i=1}^{N}p(x_{i}|\theta )

似然函数:对于不同的模型参数,出现xi的概率是多少

采用最大对数似然MLE的方法求得\theta将连乘转化成连加

\theta _{MLE}=argmax_{\theta }\sum_{i=1}^{N}logp(x_{i}|\theta )

应用:一系列的统计机器学习算法

应用步骤(最优化理论):1、建立模型。2、定义损失函数。3、最优化损失函数。

二、贝叶斯派

贝叶斯派认为参数\theta不是一个未知常量,而是随机变量。这个\theta满足一个预设的先验分布。

根据贝叶斯定理:

p(\theta |X)=\frac{p(X|\theta *p(\theta ))}{\int_{\theta }^{}p(X|\theta)*p(\theta)d\theta}

其中后验概率:在观察到新数据之后,对事件发生概率的更新估计

先验概率:基于已有经验或知识对事件发生概率的初始估计

最大化参数后验,可以省略上式中的分母,因为分母和参数\theta无关。

\theta _{MAP}=argmax_{\theta}p(X|\theta )*p(\theta )

得到后验分布后可以将分布用于预测贝叶斯预测

p(x_{new}|X)=\int_{\theta }^{}p(x_{new}|\theta )*p(\theta|X)d\theta

应用:概率图模型

三、二者的联系

假设先验分布是均匀分布,取后验概率最大,就从贝叶斯估计转化成了极大似然估计。

参考

(系列一) 绪论-频率派vs贝叶斯派_哔哩哔哩_bilibili

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值