机器学习实战 - 第四章基于概率论的分类方法：朴素贝叶斯 - 学习随手记

最新推荐文章于 2024-05-03 11:17:52 发布

原创

最新推荐文章于 2024-05-03 11:17:52 发布 · 559 阅读

1 ·

CC 4.0 BY-SA版权

本文介绍了朴素贝叶斯分类器的基本原理，包括其假设特征相互独立的特点以及两种常见的实现方式——贝努利模型和多项式模型。通过示例展示了如何使用朴素贝叶斯进行文本分类，并提供了训练和测试过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

朴素贝叶斯
- 一个特征或者单词出现的可能性与它和其他单词相邻没有关系
- 每个特征同等重要
朴素贝叶斯分类器通常有两种实现方式
- 基于贝努利模型实现

不考虑词在文档中出现的次数，只考虑出现与否，在这个意义上相当于假设词是等权重的

基于多项式模型实现

考虑词在文档中出现的次数

Page61 在转换成矩阵的时候，可不可以在每个行向量后面再加一位，表明这个整体是1还是0？（是坏句子还是好句子）

>>> for postinDoc inlistOPosts:

... trainMat.append(bayes.setOfWords2Vec(myVocabList, postinDoc))

...

>>> p0V, p1V, pAb =bayes.trainNB0(trainMat, listClasses)

>>> pAb

0.5

>>> p0V

array([ 0.04166667, 0.08333333, 0.04166667, 0.04166667, 0. ,

0. , 0.04166667, 0.04166667, 0.04166667, 0.125 ,

0.04166667, 0.04166667, 0.04166667, 0.04166667, 0.04166667,

0. , 0. , 0. , 0. , 0.04166667,

0.04166667, 0. , 0. , 0.04166667, 0. ,

0.04166667, 0.04166667, 0.04166667, 0.04166667, 0. ,

0. , 0.04166667])

>>> p1V

array([ 0. , 0.05263158, 0.10526316, 0. , 0.05263158,

0.10526316, 0.05263158, 0.05263158, 0. , 0. ,

0. , 0. , 0. , 0.

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

靠靠的博客

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

《机器学习实战》第4章基于概率论的分类方法：朴素贝叶斯 代码

zrh_优快云的博客

06-14

361

'''Created on Oct 19, 2010@author: Peter'''from numpy import *def loadDataSet(): postingList=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'], ['maybe', 'not', 'take', 'h...

机器学习-------第四章 基于概率论的分类方法：朴素贝叶斯

wyxiaoxiannv的博客

08-11

573

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤 1.引入库 2.读入数据总结前言前两章我们要求分类器做出艰难的决策，也就是给出明确答案，有事务分类器也会产生错误，这时可以要求给出一个最优类别的猜测结果，并给出猜测概率的估计值。一、朴素贝叶斯的学习目标 1.使用概率分布进行分类 2.学习朴素贝叶斯分类器 3.解析RSS源数据 4.使用朴素贝叶斯来分析不同地区的态度二、使用步骤

参与评论您还未登录，请先登录后发表或查看评论

机器学习实战读书笔记(四)基于概率论的分类方法：朴素贝叶斯

ddem35827的博客

02-06

213

4.1 基于贝叶斯决策理论的分类方法　　朴素贝叶斯 　　优点：在数据较少的情况下仍然有效，可以处理多类别问题　　缺点：对于输入数据的准备方式较为敏感　　适用数据类型：标称型数据　　贝叶斯决策理论的核心思想：选择具有最高概率的决策。 4.2 条件概率 4.3 使用条件概率来分类 4.4 使用朴素贝叶斯进行文档分类　　朴素贝叶斯的一般过程：　　1.收集数据 ...

机器学习实战python版第四章基于概率论的分类方法 朴素贝叶斯

XD_Senior的博客

11-30

1509

我们知道让机器给出该数据属于哪一类这样问题明确的答案是有困难的，当有一些误差存在的时候，我们希望机器可以判断属于哪一类的概率更大一些，以此来划分数据。如上图所示，我们有一个数据集，他有两类数据组成，现在有一个新的数据点（x，y），我们需要判别它属于哪个数据集，我们已经学了两种方法：（1）使用第一章的kNN，进行大量的距离计算来判断这个点属于哪一类。（2）使用第二章的决策树，

机器学习实战---读书笔记：第4章基于概率论的分类而方法：朴素贝叶斯

qingyuanluofeng的专栏

03-21

558

内容来源于书《机器学习实战》 # *-* coding: utf-8 *-* ''' >---读书笔记：第4章基于概率论的分类而方法：朴素贝叶斯 关键: 1 基于贝叶斯决策理论的分类方法优点：可处理多分类问题，数据较少仍有效缺点：对输入数据的准备方式敏感适用：标称型数据(目标变量只在有限集合中选取，例如真假)。例如，文档分类贝叶斯决策理论的核心思想：选择高概率对应类别贝叶斯

机器学习实战4.1 基于概率论的分类方法：朴素贝叶斯

小明的博客

06-27

741

机器学习实战4.1 基于概率论的分类方法：朴素贝叶斯 搜索微信公众号:‘AI-ming3526’或者’计算机视觉这件小事’ 获取更多机器学习干货 csdn：https://blog.youkuaiyun.com/baidu_31657889/ github：https://github.com/aimi-cn/AILearners 一、引子最近几天一直没来得及看《机器学习实战》这本书，感觉停滞了很久，...

《机器学习实战》第四章基于概率论的分类方法：朴素贝叶斯

08-04

《机器学习实战》第四章主要探讨了基于概率论的分类方法，特别是朴素贝叶斯分类器。朴素贝叶斯是一种基于贝叶斯决策理论的分类模型，它利用条件概率来预测未知数据的类别。以下是该章节详细的知识点解析： 1. **...

机器学习实战 - 第4章基于概率论的分类方法：朴素贝叶斯

yueliang666666的博客

11-24

556

一、基于贝叶斯决策理论的分类方法 朴素贝叶斯的优点：在数据较少的情况下仍然有效，可以处理多类别问题。缺点：对于输入数据的准备方式较为敏感。使用数据类型：标称型数据(一般在有限的数据中取，而且只存在是和否两种不同的结果)。 朴素贝叶斯是贝叶斯决策理论的一部分。贝叶斯决策理论：假设有一个数据集，它由两类数据组成，在判断具体数据属于哪个类别时，会选择高概率对应的类别。这就是贝叶斯决策理论的核心思想，即选择具有最高概率的决策。贝叶斯使用先验知识和逻辑推理来处理不确定性命题。频数概率：它只从数据本身获得结论，并

第4章基于概率论的分类方法： 朴素贝叶斯

最新发布

zhangsandidi的博客

05-03

1058

称之为“朴素”，是因为整个形式化过程只做最原始、最简单的假设。

机器学习实战：基于概率论的分类方法：朴素贝叶斯（源码解析，错误分析）

老潘的博客

09-19

1538

按照惯例，先把代码粘到这里from numpy import *def LoadDataSet(): postingList = [['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'], ['maybe', 'not', 'take', 'him', 'to', 'dog', 'park',

《机器学习实战》基于概率论的分类方法：朴素贝叶斯

擎子衿的博客

12-17

250

本章内容使用概率分布进行分类学习朴素贝叶斯分类器解析RSS源数据使用朴素贝叶斯来分析不同地区的态度 朴素贝叶斯 优点：在数据较少的情况下仍然有效，可以处理多类别问题。缺点：对于输入数据的准备方式较为敏感。适用数据类型：标称型数据。 朴素贝叶斯是贝叶斯决策理论的一部分。贝叶斯决策理论的核心思想是：选择具有最高概率的决策。贝叶斯概率理论：贝叶斯概率引入先验知识和逻辑推理来处理不...

《机器学习实战》第四章基于概率论的朴素贝叶斯

yuanxun4683的博客

01-28

906

《机器学习实战》 第四章.基于概率论的分类方法朴素贝叶斯 4.1朴素贝叶斯名词概念解释贝叶斯决策论：是概率框架下实施决策的基本方法。在所有相关概率都已知的理想情形下，贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。词向量：将语言数学化，一种最简单的词向量方式是 one-hot representation，就是用一个很长的向量来表示一个词，向量的长度为词典的大小，向量的

《机器学习实战》斧头书——第四章—概率论之朴素贝叶斯（1）——使用朴素贝叶斯和Python来看看你的留言是不是非侮辱性的

一叶浮萍归大海的博客

06-19

787

目录《机器学习实战》斧头书——朴素贝叶斯一、对文章的说明1.1 对本文有几点说明如下二、项目背景2.1 背景12.2 背景22.3 任务2.4 朴素贝叶斯2.4.1 朴素贝叶斯——朴素的原因2.4.2 朴素贝叶斯——另一个假设2.4.3 朴素贝叶斯——条件概率的公式2.4.4 朴素贝叶斯——种类三、代码3.1 社区留言板的数据集3.2 总体的代码（根据公式和原理编程）3.3 看一下结果---判断的类型3.3.1 这里测试了6条自己写的留言3.3.2 这里测试了6条原始的留言四、总结《机器学习实战》斧头

《机器学习实战》第四章——朴素贝叶斯

weixin_44275584的博客

11-23

190

被称之为“朴素”，是因为只进行最原始、最简单的假设–各个特征之间没有关联性优点：数据较少的情况下依旧有效；可以处理多类别问题缺点：数据输入方式较为敏感适用于：标称型数据贝叶斯决策理论假设有统计参数,用 p1(x,y）表示数据点(x,y)属于类别1的概率， p2(x,y)表示数据点(x,y)属于类别2的概率。对于一个新的点(x’,y’),如果 p1(x’,y’) > p2(x’,y’) 那么该数据点属于类别1，反之属于类别2 贝叶斯决策理论的核心为：选择高概率对应的类别条件概率 .

机器学习实战：朴素贝叶斯分类（二）

S-H_A-N

06-25

893

使用朴素贝叶斯过滤垃圾邮件（1）收集数据：提供文本文件。（2）准备数据：将文本文件解析成词条向量。（3）分析数据：检查词条确保解析的正确性。（4）训练算法：使用我们之前建立的trainNBayes0函数（5）测试算法：使用classifyNB(),并且构建一个新的测试函数来计算文档集的错误率。（6）使用算法：构建一个完整的程序对一组文档进行分类，将错分的文档输出到屏幕上。

python内置模块[re]

weixin_30708329的博客

12-24

256

python内置模块[re] re模块： python的re模块（Regular Expression正则表达式）提供各种正则表达式的匹配操作，在文本解析、复杂字符串分析和信息提取时是一个非常有用的工具。 1、re的简介使用python的re模块，尽管不能满足所有复杂的匹配情况，但足够在绝大多数情况下能够有效地实现对复杂字符串的分析提取相关信息。python会将正则表达式转化为字节码，利...

机器学习实战---贝叶斯

qq_41100111的博客

04-18

301

def textParse(bigString): import re listOfTokens = re.split(r'\W*', bigString) return [tok.lower() for tok in listOfTokens if len(tok) > 2] 第三行报错 FutureWarning: split() requires a no...

机器学习实战错误校正

weixin_30402085的博客

10-27

633

机器学习实战书中代码用python2实现，当使用python3时会出现一些错误，这些错误由语法不同或者代码不够完善引起，学习过程中修改如下，方便大家学习。 1、page40，majorityCnt中的iteritems() （1）在Python2.x中，iteritems() 用于返回本身字典列表操作后的迭代器【Returns an iterator on all items(key...

机器学习实战：朴素贝叶斯分类方法解析

"这篇实战教程主要讲解了基于概率论的分类方法——朴素贝叶斯算法在机器学习中的应用。作者Leo提供了GitHub链接供读者查阅源代码。教程的核心思想是通过比较不同类别的条件概率来决定数据应归属的类别。条件概率、...

机器学习实战 - 第四章 基于概率论的分类方法：朴素贝叶斯 - 学习随手记

机器学习实战 - 第四章基于概率论的分类方法：朴素贝叶斯 - 学习随手记