贝叶斯-笔记(1)

最新推荐文章于 2022-10-30 18:51:17 发布

仙守

最新推荐文章于 2022-10-30 18:51:17 发布

阅读量824

点赞数

分类专栏： machine learning 文章标签： machine-learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/shouhuxianjian/article/details/65449943

版权

0 - 背景

贝叶斯是个好东西（频率学派的不这么看），好多模型都可以从贝叶斯角度来解释，而且贝叶斯决策理论也是作为最优分类，给其他模型做错误上限什么的参照的。对于分类来说，在所有相关概率都已知的情况下，贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。然而贝叶斯又分朴素贝叶斯、半朴素贝叶斯、贝叶斯网等等。

P (X, Y) = P (X | Y) P (Y) (0.1)

$P(X,Y)=P(X|Y)P(Y) \tag{0.1}$

1 - 朴素贝叶斯

所谓朴素贝叶斯，就是基于特征条件是相互独立的假设下，学习输入和输出的联合概率分布，所以它是一个生成模型。
假设输入空间是 $\chi \subseteq R^n$ 为n维向量的集合，输出空间是类别标记集合（标签） $y \in \cal Y$ .X是定义在输入空间 $\chi$ 上的随机向量，Y是定义在输出空间 $\cal Y$ 上的随机变量。P(X,Y)是X和Y的联合概率分布。假设训练集:

T = (x 1, y 1), (x 2, y 2), . . ., (x N, y N)

$T={(x_1,y_1),(x_2,y_2),...,(x_N,y_N)}$
是由P(X,Y)独立同分布生成的。
朴素贝叶斯就是通过训练集学习数据的联合概率分布，而因为可以通过贝叶斯公式转换成先求

P(Y=ck) $P(Y=c_k)$ ,

k=1,2,...,K $k=1,2,...,K$ 和

P(X=x|Y=ck) $P(X=x|Y=c_k)$ .而因为

P (X = x | Y = c k) = P (X (1), X (2), . . ., X (n) | Y = c k)

$P(X=x|Y=c_k)=P(X^{(1)},X^{(2)},...,X^{(n)}|Y=c_k)$
可以看出训练集每个特征之间是存在某种潜在关联的。如果特征还是连续值，那么基本上就是指数级的参数了。如果假设

x(j) $x^{(j)}$ 可取值有

Sj $S_j$ 个，j=1,2,..,n，Y取值有K个，那么参数个数为

K∏nj=1Sj $K\prod_{j=1}^nS_j$ 。
朴素贝叶斯就是将其看成是相互独立的，因为这个假设条件很强，所以也是朴素贝叶斯的名字由来。即：

P (X = x | Y = c k) = = P (X (1) = x (1), X (n) = x (n) | Y = c k) \prod i = 1 n P (X (i) = x (i) | Y = c k)

$\begin{eqnarray} P(X=x|Y=c_k) &=&P(X^{(1)}=x^{(1)},X^{(n)}=x^{(n)}|Y=c_k)\\ &=&\prod_{i=1}^nP(X^{(i)}=x^{(i)}|Y=c_k) \end{eqnarray}$
从而

P (Y = c k | X = x) = = = = P ( Y = c k , X = x ) P ( X = x )

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。