9、朴素贝叶斯分类器的存储模型

c6d7e8f9g

于 2025-09-25 09:03:36 发布

阅读量21

点赞数

CC 4.0 BY-SA版权

分类专栏：从零开始学R与机器学习文章标签：朴素贝叶斯分类器条件概率

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/c6d7e8f9g/article/details/152438585

从零开始学R与机器学习专栏收录该内容

17 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

朴素贝叶斯分类器的存储模型

1. 引言

在机器学习中，以一个简单的线性模型 $Y = a X1 + b$ 为例，其中 $X1$ 是数值输入变量，$Y$ 是数值输出。训练数据会确定系数 $a$ 和 $b$，这些系数包含了学习到的信息。一旦得到这些系数，训练数据就不再需要保留，模型可以用于新数据。

在开发分类器时，通常会忽略存储学习信息这一步骤。但为了完整性和编程需求，我们需要讨论算法如何对结果进行分类（或预测），以及如何存储在训练集上学习到的信息，以便应用于新的未标记数据。在基于参数的机器学习中，通过训练数据学习到的信息存储在参数中（与非参数算法如 KNN 相对）。这里的“参数”与函数签名中的“参数”含义不同，前者是计算机科学术语，后者是统计学术语。

我们使用在训练集上学到的参数对测试集进行预测，这样可以通过在未见过的数据上测试来评估算法的准确性。对于之前实现的朴素贝叶斯算法，现在的额外编程任务是构建一个结构来存储学习到的参数，并编写一个函数在运行时动态读取该结构。

2. 存储学习到的条件概率的矩阵

本章代码的主要更改是添加一个结构来存储参数，即一组矩阵，用于存储在模型训练过程中学习到的条件概率。对于每个输入变量，我们会创建一个矩阵，矩阵的行是类变量的水平，列是相关输入变量的水平，矩阵的单元格存储条件概率。

例如，对于 nominal.weather 数据框，输入变量 humidity 有两个水平： high 和 normal ，类变量 play 有两个水平：

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。