7、完全贝叶斯算法：原理、实现与优化

最新推荐文章于 2025-09-29 08:30:00 发布

c6d7e8f9g

最新推荐文章于 2025-09-29 08:30:00 发布

阅读量20

点赞数

CC 4.0 BY-SA版权

分类专栏：从零开始学R与机器学习文章标签：完全贝叶斯分类器 R实现数据科学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/c6d7e8f9g/article/details/152438577

从零开始学R与机器学习专栏收录该内容

17 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

完全贝叶斯算法：原理、实现与优化

1. 数据科学中的分类任务

在数据科学领域，理解数据是核心任务，而大部分时间里，我们的目标是对数据进行分类或估计，也就是确定特定记录所属的类别或估计某个数值。除了分类和估计，数据科学家还会进行数据可视化和预处理等工作，但核心任务仍是分类和估计。

以在线巧克力商店为例，该商店希望根据顾客对黑巧克力、牛奶巧克力、白巧克力的偏好或对它们的厌恶程度对顾客进行分类。这里的输出变量“巧克力类型”是一个分类变量，若用 C 表示该变量，并在 R 中编码为因子，则 C 有四个水平：黑巧克力、牛奶巧克力、白巧克力和无偏好。

同时，商店收集了顾客的以下信息作为输入变量：
| 变量 | 含义 |
| ---- | ---- |
| A | 年龄（年轻(<18)、中年(18 - 35)、老年(>35)） |
| G | 性别（F/M） |
| S | 是否喜欢辛辣食物（Y/N） |
| I | 是否喜欢冰淇淋（Y/N） |
| W | 体重超重或不足的千克数（数值型） |
| D | 是否节食（Y/N） |

需要注意的是，除了 W 是数值型变量外，其他均为分类变量。由于我们构建的贝叶斯类型算法无法处理像 W 这样的数值型变量，所以暂时不使用该部分数据集。

我们的目标是根据输入变量 [A, G, S, I, D] 的一组值来预测类变量 C（偏好的巧克力类型）的值。例如，对于顾客 [A = 年轻, G = F, S = N, I = Y, D = N]，我们需要判断他们是偏好黑巧克力、牛奶巧克力还是白巧克力。

我们假设输入和输

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。