【概率论】贝叶斯法则

本文详细阐述了概率论中的核心概念,包括联合概率、条件概率及贝叶斯法则,并通过实例帮助理解这些概念的应用场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

基础知识描述:

联合概率:

定义:指在多元的概率分布中多个随机变量同时满足各自条件的概率。

举例:假设X和Y都服从正态分布,那么P{X<4,Y<0}就是一个联合概率,表示X<4,Y<0两个条件同时成立的概率。X与Y的联合概率表示为 P(XY) 或者P(X,Y),或者P(X∩Y)

 

条件概率:

定义:事件A在另外一个事件B已经发生条件下的发生概率。

举例:在B条件下A条件概率表示为P(A|B)

 

贝叶斯法则:

通常,事件A在事件B(发生)的条件下的概率,与事件B在事件A的条件下的概率是不一样的;然而,这两者是有确定的关系,贝叶斯法则就是这种关系的陈述。作为一个规范的原理,贝叶斯法则对于所有概率的解释是有效的;然而,频率主义者和贝叶斯主义者对于在应用中概率如何被赋值有着不同的看法:频率主义者根据随机事件发生的频率,或者总体样本里面的个数来赋值概率;贝叶斯主义者要根据未知的命题来赋值概率。一个结果就是,贝叶斯主义者有更多的机会使用贝叶斯法则。

故:如果只有A、B两个事件,那么可得出如下:

 P(A|B)= P(AB) / P(B),P(B|A) = P(AB)/ P(A) ==> P(A|B) = P(B|A) * P(A) / P(B)

故:贝叶斯法则是关于随机事件A和B的条件概率和边缘概率的。

 P(A|B) = P(B|A) * P(A) / P(B) ≈ L(A|B) * P(A)

其中L(A|B)是在B发生的情况下A发生的可能性。

在贝叶斯法则中,每个名词都有约定俗成的名称:

1.P(A)是A的先验概率或边缘概率。之所以称为"先验"是因为它不考虑任何B方面的因素。    2.P(A|B)是已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率。

3.P(B|A)是已知A发生后B的条件概率,也由于得自A的取值而被称作B的后验概率。

4.P(B)是B的先验概率或边缘概率,也作标准化常量(normalized constant)。

贝叶斯法则公式:

    后验概率 = (似然度 * 先验概率)/标准化常量

    即:后验概率与先验概率和似然度的乘积成正比。

    故:后验概率 = 标准似然度 * 先验概率

举例:

    对于事件A、B,A后验概率表示P(A|B),A先验概率表示P(A),似然度为P(B|A),标准化常量P(B),故标准似然度为P(B|A)/P(B)

转载于:https://www.cnblogs.com/ariesblogs/p/4048670.html

资源下载链接为: https://pan.quark.cn/s/22ca96b7bd39 在当今的软件开发领域,自动化构建与发布是提升开发效率和项目质量的关键环节。Jenkins Pipeline作为一种强大的自动化工具,能够有效助力Java项目的快速构建、测试及部署。本文将详细介绍如何利用Jenkins Pipeline实现Java项目的自动化构建与发布。 Jenkins Pipeline简介 Jenkins Pipeline是运行在Jenkins上的一套工作流框架,它将原本分散在单个或多个节点上独立运行的任务串联起来,实现复杂流程的编排与可视化。它是Jenkins 2.X的核心特性之一,推动了Jenkins从持续集成(CI)向持续交付(CD)及DevOps的转变。 创建Pipeline项目 要使用Jenkins Pipeline自动化构建发布Java项目,首先需要创建Pipeline项目。具体步骤如下: 登录Jenkins,点击“新建项”,选择“Pipeline”。 输入项目名称和描述,点击“确定”。 在Pipeline脚本中定义项目字典、发版脚本和预发布脚本。 编写Pipeline脚本 Pipeline脚本是Jenkins Pipeline的核心,用于定义自动化构建和发布的流程。以下是一个简单的Pipeline脚本示例: 在上述脚本中,定义了四个阶段:Checkout、Build、Push package和Deploy/Rollback。每个阶段都可以根据实际需求进行配置和调整。 通过Jenkins Pipeline自动化构建发布Java项目,可以显著提升开发效率和项目质量。借助Pipeline,我们能够轻松实现自动化构建、测试和部署,从而提高项目的整体质量和可靠性。
### 贝叶斯定理的概念 贝叶斯定理是概率论中的一个重要公式,用于描述两个条件概率之间的关系。具体来说,该定理提供了一种方法来更新关于假设的概率估计,当新的证据或数据变得可用时[^2]。 贝叶斯定理可以用下面的公式表示: \[ P(A|B) = \frac{P(B|A)\,P(A)}{P(B)} \] 其中, - \( P(A|B) \) 是在给定 B 发生的情况下 A 的条件概率; - \( P(B|A) \) 是在给定 A 发生的情况下 B 的条件概率; - \( P(A) \) 和 \( P(B) \) 分别是不考虑对方影响下各自的发生概率。 这个公式的直观意义在于它允许人们基于已有信息调整对于某事件发生的信念强度[^4]。 ### 应用场景之一:朴素贝叶斯分类器 在机器学习中,朴素贝叶斯分类器是一个广泛应用的例子。这种模型假定了特征之间相互独立(即“朴素”的含义),这使得计算变得更加简单高效。尽管这一假设通常并不完全成立,但在许多实际情况下仍然能够取得不错的效果[^1]。 ```python from sklearn.datasets import fetch_20newsgroups from sklearn.feature_extraction.text import CountVectorizer from sklearn.naive_bayes import MultinomialNB from sklearn.pipeline import make_pipeline from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # 加载新闻组数据集并创建训练/测试分割 data = fetch_20newsgroups() X_train, X_test, y_train, y_test = train_test_split(data.data, data.target) # 构建一个简单的文本分类管道 model = make_pipeline(CountVectorizer(), MultinomialNB()) # 训练模型并对测试集预测 model.fit(X_train, y_train) predicted_labels = model.predict(X_test) print(f'Accuracy: {accuracy_score(y_test, predicted_labels):.3f}') ``` 这段代码展示了如何利用 `scikit-learn` 中内置的支持向量机来进行文档分类的任务。这里使用的是多项式朴素贝叶斯分类器 (`MultinomialNB`),非常适合于离散型的数据比如词频矩阵[^5]。 ### 自然语言处理中的应用 除了作为分类工具外,在自然语言处理(NLP)领域内也有着广泛的应用案例。例如垃圾邮件过滤、情感分析以及主题建模等方面都可以见到贝叶斯理论的身影。通过构建合适的先验分布,并结合具体的观测数据,可以有效地提高系统的性能和准确性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值