统计学习笔记（4）——朴素贝叶斯法

最新推荐文章于 2025-07-14 16:24:29 发布

qll125596718

最新推荐文章于 2025-07-14 16:24:29 发布

阅读量1.8w

点赞数 11

CC 4.0 BY-SA版权

分类专栏：数据挖掘与机器学习

本文链接：https://blog.youkuaiyun.com/qll125596718/article/details/8445217

数据挖掘与机器学习专栏收录该内容

19 篇文章

订阅专栏

本文介绍朴素贝叶斯分类器的基本原理及其应用。通过分析贝叶斯定理及特征条件独立假设，展示了如何利用有限训练数据进行有效分类。并通过实例说明了朴素贝叶斯分类器的工作过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。简单来说，朴素贝叶斯分类器假设样本每个特征与其他特征都不相关。举个例子，如果一种水果具有红，圆，直径大概4英寸等特征，该水果可以被判定为是苹果。尽管这些特征相互依赖或者有些特征由其他特征决定，然而朴素贝叶斯分类器认为这些属性在判定该水果是否为苹果的概率分布上独立的。尽管是带着这些朴素思想和过于简单化的假设，但朴素贝叶斯分类器在很多复杂的现实情形中仍能够取得相当好的效果。朴素贝叶斯分类器的一个优势在于只需要根据少量的训练数据估计出必要的参数（离散型变量是先验概率和类条件概率，连续型变量是变量的均值和方差）。

1.贝叶斯分类模型

贝叶斯分类模型如下：

其中，X表示属性集，Y表示类变量，P(Y)为先验概率，P(X|Y)为类条件概率，P(X)为证据，P(Y|X)为后验概率。贝叶斯分类模型就是用先验概率P(Y)、类条件概率P(X|Y)和证据P(X)来表示后验概率。在比较Y的后验概率时，分母中的证据P(X)总是常数，因此可以忽略不计。先验概率P(Y)可以通过计算训练集中属于每个类的训练记录所占的比例很容易估计。对类条件概率P(X|Y)的估计，不同的实现决定不同的贝叶斯分类方法，常见的有朴素贝叶斯分类法和贝叶斯信念网络。