朴素贝叶斯算法

最新推荐文章于 2024-04-22 22:20:34 发布

原创最新推荐文章于 2024-04-22 22:20:34 发布 · 627 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#神经网络 #算法 #优化 #c语言 #数据

机器学习专栏收录该内容

11 篇文章

订阅专栏

本文探讨了朴素贝叶斯算法的基本原理及其在文本分类中的应用。通过介绍算法的数学模型，包括特征独立性的假设及如何计算不同类别下的特征概率，为读者提供了深入理解该算法的途径。

朴素贝叶斯算法是个神奇的东西，假定了特征的独立性，却还是在文本分类中有很高的精确度。

我们这里的x=（x1，x2，x3,.....xn）表示数据的特征，y=｛c1，c2....cm｝表示分类个数。

贝叶斯公式argmax p（y=ck|x） = p(x,y=ck)/p(x) = p(y=yk)*(x|y=yk)/p(x);

很明显这里把因果颠倒了。

当x的各个特征独立时，p（x|y=ck） = ∏i （p（xi|y=ck）），带入公式得 argmax p（y=ck|x） = p(x,y=ck)/p(x) = p(y=yk)*p(x|y=yk)/p(x) = p(y=yk)*∏i （p（xi|y=ck））/p(x)

对于每个ck而言p（x）都是相等的，所以可以写成 agrmax p(y=yk)*∏i （p（xi|y=ck））

根据先验的极大似然函数可以得到

p（y=ck）和p（xi|y=ck）就是先验数据中的频率。推导比较麻烦，还在研究中。

准备做一个文本分类。

代码后续补上

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。