贝叶斯方法与高斯过程详解
1. 贝叶斯方法与正则化的联系
在贝叶斯方法中,最大后验(MAP)估计与正则化最大似然估计之间存在着紧密的联系。当正则化与先验的对数成正比时,这种联系就会显现出来。例如,对于特定的先验 $p(\theta)$,MAP 估计与 $L_2$ 正则化估计是相同的。如果我们为 $\theta$ 选择拉普拉斯先验,那么 MAP 估计将等同于 $L_1$ 正则化。实际上,许多正则化方法都可以被解释为隐式地选择了某种先验。
这种与正则化的联系为我们理解为什么贝叶斯方法不太容易过拟合提供了另一个视角。不过,需要注意的是,贝叶斯方法与正则化的使用并不意味着这两种方法是等价的。贝叶斯方法的核心仍然是为 $\theta$ 计算后验分布,而不仅仅是得到一个点估计 $\hat{\theta}$。
2. 高斯过程简介
高斯过程是一种将贝叶斯思想应用于非参数模型的方法。在传统的贝叶斯方法中,我们将未知参数 $\theta$ 视为随机变量,并学习其后验分布 $p(\theta | y)$。而在高斯过程中,我们将整个函数 $f(x)$ 视为一个随机过程,并计算其后验 $p(f(x) | y)$。高斯过程本质上是将贝叶斯方法应用于核岭回归。
2.1 什么是高斯过程
高斯过程是一种特殊的随机过程,而随机过程是随机变量的一种推广。通常,我们可以将随机过程看作是随时间变化的随机量,数学上表示为一组由时间 $t$ 索引的随机变量 ${z(t) : t \in R}$。对于每个时间点 $t$,$z(t)$ 都是一个随机变量,并且不同时间点的值通常是相关的,这种相关性取决于时间差。
更抽象地说,我们可以将 $z(t
超级会员免费看
订阅专栏 解锁全文
13

被折叠的 条评论
为什么被折叠?



