周志华 机器学习 Day11

本文介绍了贝叶斯决策论的基本概念,探讨了基于概率框架的分类任务,并详细解释了贝叶斯判定准则及其应用。文章还讨论了两种估计后验概率的方法:判别式模型与生成式模型,并介绍了朴素贝叶斯分类器的工作原理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

贝叶斯分类器

贝叶斯决策论

贝叶斯决策论是概率框架下实施决策的基本方法。对分类任务来说,在所有相关概率都已知的理想情形下,贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。

假设有N种可能的类别标记,即y={c1,c2,.....,cN},是将一个真实标记为cj的样本误分类为ci所产生的损失,基于后验概率P(ci | x)可获得将样本x分类为ci所产生的期望损失,即在样本x上的“条件风险”


我们的任务是寻找一个判定标准h:X->Y以最小化总体风险。

贝叶斯判定准则:为最小化总体风险,只需在每个样本上选择哪个能使条件风险R(c | x)最小的类别标记。

具体来说,若目标是最小化分类错误率,则误判损失可写为


此时条件风险


于是,最小化分类错误率的贝叶斯最优分类器为


不难看出,欲使用贝叶斯判定准则来最小化决策风险,首先要获得后验概率P(c | x),这在现实中是难以直接获得的。

对于后验概率的估计有两种方法:(1)“判别式模型”,给定x,通过直接建模P(c | x)来预测c (2)“生成式模型”,对联合概率分布P(x,c)建模得到P(c | x);一般地,有决策树、BP神经网络、支持向量机

对生成式模型来说,必然考虑


基于贝叶斯定理,P(c | x)可写为

事实上,概率模型的训练过程就是参数估计过程。

朴素贝叶斯分类器

基于贝叶斯公式估计后验概率P(c | x)的主要困难在于:类条件概率P(c | x)是所有属性上的联合概率,难以从有限训练样本直接估计而得。为了避开这个障碍,朴素贝叶斯分类器采用了“属性条件独立性假设”:对已知类别,假设所有属性相互独立。换言之,假设每个属性独立地对分类结果发生影响。

基于属性条件独立性假设,可得

其中,d为属性数目,xi为x在第i个属性上的取值。

### 关于周志华机器学习》中的公式推导 为了更好地理解周志华机器学习》中的公式推导,可以从几个方面入手: #### 1. 掌握基础知识 确保具备足够的数学背景知识对于理解和掌握书中涉及的各种公式至关重要。这包括但不限于线性代数、概率论与统计学的基础概念[^3]。 #### 2. 阅读相关章节并跟随逻辑推理 每章开头通常会给出该部分的核心思想和目标,在阅读过程中应当注意作者是如何逐步引入新的知识点,并通过具体的例子或应用场景加深理解。当遇到复杂的定理证明时,建议先尝试自己思考其背后的原理再对照原文验证自己的想法是否正确[^4]。 #### 3. 参考其他资源辅助学习 如果觉得某些地方难以理解,则可以寻找额外的学习材料作为补充说明。例如,《机器学习》这本书在系列原创机器学习30讲的基础上进行了扩展,提供了详细的公式推导和代码实现案例,有助于更深入地了解各个算法的工作机制及其数学依据[^1]。 #### 4. 实践练习巩固所学内容 理论联系实际是提高编程能力和解决具体问题的有效途径之一。可以通过编写简单的程序来重现书中的实验结果或是参与开源项目贡献等方式积累经验。此外,“南瓜书”也是一份非常有价值的参考资料,它记录了许多人在自学过程中遇到的问题及解决方案,可以帮助读者克服难关成为更加优秀的开发者。 ```python import numpy as np def calculate_gradient(X, y, w): """ 计算梯度下降法中的梯度 参数: X (numpy.ndarray): 输入特征矩阵 y (numpy.array): 输出标签向量 w (numpy.array): 权重参数 返回: grad_w (numpy.array): 对w求偏导后的梯度值 """ N = len(y) predictions = 1 / (1 + np.exp(-X.dot(w))) error = predictions - y grad_w = (1/N) * X.T.dot(error) return grad_w ``` 此函数展示了如何基于给定的数据集计算逻辑回归模型中权重更新所需的梯度,这是许多机器学习教材都会讨论的一个典型实例。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值