机器学习算法之 朴素贝叶斯 分类

本文详细介绍了朴素贝叶斯分类算法的核心思想、原理、实例以及代码实现。通过留言板分类的例子,阐述如何利用条件概率和独立特征假设进行训练和测试,展示了如何将文本转化为词向量并计算各类别的概率,最后提供了训练和测试算法的代码片段。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


 基于概率论的分类算法:朴素贝叶斯

1、核心思想:选择高概率对应的类别

 如下图:

 两类数据分布如下,用p1(x,y)表示数据点(x,y)属于类别1(图中圆点表示的类别)的概率,用p2(x,y)表示数据点(x,y)

 属于类别2(图中三角形点表示的类别)的概率,那么对于一个新数据点(x,y),可以用下面的规则来判断他的类别:

  1)如果p1(x,y) > p2(x,y),那么类别为1

  2)如果p2(x,y) > p1(x,y),那么类别为2

 也就是,我们会选择高概率对应的类别,这就是贝叶斯理论的核心思想

在这里插入图片描述

2、算法原理

 贝叶斯条件概率准则(计算条件概率的方法)
在这里插入图片描述
 已知条件p(X|C),得到p(C|X)的条件概率,条件概率基本概念读者执行补读下

 使用贝叶斯条件概率准则(条件概率)分类
在这里插入图片描述

3、实例

 以留言板分类为例,分类一个留言板是否友好,

 找出单词的概率, 认为这些单词出现的概率是独立的(实际上并不是很准确,有些单词可能有相互依赖,但不影响算法),即独立

 的特征概率,朴素贝叶斯的朴素

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值