本文将叙述朴素贝叶斯算法的来龙去脉,从数学推导到计算演练到编程实战
文章内容有借鉴网络资料、李航《统计学习方法》、吴军《数学之美》加以整理及补充
基础知识补充:
1、贝叶斯理论–吴军数学之美
http://mindhacks.cn/2008/09/21/the-magical-bayesian-method/
2、条件概率
3、联合分布
朴素贝叶斯算法
朴素贝叶斯法是基于贝叶斯定理和特征条件独立假设的
分类方法。给定训练数据集,首先基于特征条件独立假设学习
输入/输出的联合概率分布,然后根据此模型,对给定的输入x,
利用贝叶斯定理求出后验概率最大的输出y。
朴素贝叶斯法属于生成方法,关键在于找到输入输出的联合分
布,或者说确定联合分布的参数也就确定了联合分布。在特征条
件独立的假设下,对每一个特征通过频率求解其条件概率分布,
这些条件概率分布最终用于求解后验概率。
推导约定:
朴素贝叶斯算法通过训练数据集学习联合概率分布P(X|Y) ,具体地,学习先验概率分布
以及条件概率分布

本文深入浅出地介绍了朴素贝叶斯算法,包括贝叶斯理论、条件概率、联合分布等基础知识,并详细阐述了算法的原理、条件独立假设以及推导过程。还探讨了在特征值不在训练集时的拉普拉斯平滑处理。最后,通过实例和scikit-learn库的使用,展示了如何将理论应用于实践。
最低0.47元/天 解锁文章
390

被折叠的 条评论
为什么被折叠?



