再识概率论

本文探讨概率论的基础概念,通过三个问题解析概率、条件概率和贝叶斯定理。问题1关注概率的定义,区分不同类型的概率表述;问题2讨论条件概率如何影响事件理解,举例骰子和天气情况;问题3深入解释贝叶斯公式,揭示先验概率和后验概率的关系。总结强调理解样本空间划分、条件概率的计算以及概率推理的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

概述

因为本人对于贝叶斯的神奇的渴望,以及对概率论体系的重视。发现自己对概率的定义仍然不清晰,这里提出一些小例子,进行分析,并回顾概率论最基础知识。大神请绕路!

问题1:
P(猪) 大家是不是觉得猪的概率这个说法很奇怪。
P(红球) 这个好像也是数学书里面经常出现的。
P(骰子为6) 大家是不是觉得骰子为6的概率貌似又比较正常,这个里面的区别到底在哪里呢?

问题2:
P(今天下雨)、P(今天下雨|昨天下雨),问题都是对于今天下雨的表述,那么我们考虑昨天下雨对今天下雨的影响时,我们是如何从概率论的角度理解的呢?

问题3:
一个比较简单的例子,例子仅为教学,如有冒犯请见谅。
P(非洲人|黑人) = P(非洲人)*P(黑人|非洲人)/P(黑人)
这里假设所有的黑人都是非洲人,但不是所有的非洲人都是黑人(好绕口,我简单画一下吧!)
人 人 人 人
非洲黑 非洲黑 非洲白 亚洲白

目标

上面我提出了3个问题,这里我把我想说的给提出来先。
针对第一个问题,我想从概率论的理论体系去分析,什么是概率,哪些东西是可以概率化的。
针对第二个问题,我想说明条件概率是什么,以及我们生活中的条件概率和课本里面条件概率。
针对第三个问题,我想说明贝叶斯是什么,以及如果感性的去理解贝叶斯这个东西,以及我们生活中我们都是怎么贝叶斯思考的(这里提出我们很大程度上用了似然,并没有去考虑真正的贝叶斯)。

问题1——什么是概率

这里先抄袭一段话“概率是用来描述对不确定性事件的信念程度,在很多时候用频率解释是合适的。但是很多时候,比如:一个学者有90%的把握断言《伊利亚特》、《奥德赛》是有同一作者创作的。这个里面概率仅仅是学者的主观信念。许多人由此认为主观信念是不值得研究的,至少从数学和科学的角度是这样。但在人们实际生活中,人们面对不确定性的时候,经常不得不作出抉择,这时候他们需要一个主观信念作为一个先决条件,因此发掘概率模型描述不确定性的艺术和提高概率模型的推理的有必要的。”
所谓的概率模型,它是一种对不确定现象的数学描述,定义如下:

概率模型的基本构成
·样本空间Ω,这是一个试验的所有可能结果的集合。
·概率律,概率律为试验结果的结合A(事件)确定一个非负数P(A)。这个非负数刻画了我们对事件A的认识或所产生的信念程度

样本空间性质:互斥性、不唯一性(这里是我自己想的,下面画图说明了问题)

下图是对概率模型的描述,任何我们P概率对象描述的都是一个事件,我们必须清楚的认识到样本空间。


我们用骰子的例子来做一下分析,试验:我们扔一次骰子,记录骰子结果。事件我们按照所有的点数划分,那么有6个事件。当然只要满足相互排斥的特性,我们可以根据我们研究的兴趣建立不同的样本空间。比如我们还可以建立一个样本空间:事件A(大于2)、事件B(小于等于2),如下图:

好啦,我们来整理一下思路。首先我们说“骰子是6”是一个事件,它的试验是记录一个骰子点,然后我们blabla算了一下概率,这是我们上课的思路。那么P(猪)肯定是一个简化的事件描述,而且我们也已经讨论过,只有事件才是有概率可言的,我们可以说。我面前有一只动物,它是猪的概率是多少。首先这个过程与骰子不太一样,是一个生活中可能出现的例子,我们现在从概率论的角度去看待,所以第一步就是去划分样本空间,然后去分析概率如何计算。下面我对比一下思路过程!
骰子思路:
老师说我们来学概率论(起因)->我们抛了一次骰子,记录了点数(一个试验)-> 老师说我们把6个结果都列出来(划分样本空间)->老师说1的概率是1/6(离散模型计算概率)
女朋友概率的思路:
我自己想对一个东西去分析一下我的信念程度,比如你女朋友生气了,你想知道她生气是不是因为你要她多喝开水-_-!(起因)->判断女朋友生气的事件原因(确认一个试验)->昨天要她多喝水了、A、B等理由,这里假设这些理由是相互独立无关的,但是貌似不科学,先这样理解吧(划分样本空间)-> 你可以贝叶斯一下P(女朋友生气|要她喝水)=P(女朋友生气)* P(要女朋友喝水|女朋友生气) / P(要她喝水)这里仅仅是提供下乐趣,貌似分析不出来什么呢,因为,似然概率( P(要女朋友喝水|女朋友生气))没有什么用这里。这里算强行一波吧!(计算概率)

到这里,我第一个问题算是回答了,我解释了什么是概率模型,然后解释了生活中和书本中概率论使用的不同思路,最后还是强调一下,我们要学会划分样本空间,然后找到计算概率的方法。比如P(女朋友生气),这里面样本空间就是女朋友生气和开心(默认不生气就开心)、这里生不生气是一个状态,我们统计计算肯定不方便。所以我们在假设女朋友心情随时间均匀分布的情况下,用一个时间点的状态来概括整个心情,我们统计每天某时刻她的心情,就可以计算这个概率啦~

问题2

P(今天下雨)和P(今天下雨|昨天下雨),现在假如昨天下雨,今天下雨的可能性更大,那么也就是说我对这个事件有了新的条件。在《概率论导论》中,条件概率是一种新的概率律,也就是他符合普通概率的三条性质(非负,规范,可列可加)。先看一下条件概率的公式:
P(A|B) = P(AB)/P(B),书中有这样的描述,如果样本空间中有事件A,事件B。那么P(A|B)相当于压缩了样本空间,并改变了事件的划分。这里可以理解为,样本空间从整个事件集合变成了B,而事件变成了AB和(非A)B,即重合部分与B面积的比值。
这里写图片描述
那么我还是延续之前的思路,我们来看看这个条件的引入都是怎么思路。
eg1:我们掷骰子2次,记录数据。
P(两次和大于6),P(两次和大于6|第一次大于4),下图1表示第一次我的样本空间划分,因为我考虑两次的和,我可以划分成两个很粗的样本空间。现在我们有了条件,那么我们修改了我们的样本空间划分,成了右边图的样子,同时由于引入了条件,我们的总集合变成了蓝色的区域,也就是被压缩了。这里插一句,我们修改事件的方式就是去找事件A和时间B的联合事件。
这里写图片描述这里写图片描述
然而有一些情况,比如P(非洲人|黑人),我现在不知道每个人具体是什么样的,但是我知道P(黑人|非洲人)、P(非洲人)、P(黑人),我们就不太好使用计数的方式把条件概率表述出来,虽然我们样本空间还是可以划分的很细,具体到每个人的肤色和区域,但是这时我们的计算方式需要改进,因为计数已经不太能很好的得出结果,不像骰子一样我们可以列出所有可能的结果。

上面这些想法都是我自己的理解,所以和书中差异较大,我来总结一下。我们现在暂时可以得出一个结论是这样,我们有了条件的时候,我们首先需要去找联合事件,已经条件事件。分别求出联合概率和条件事件概率(归一化概率)。其实有的时候如果只是做比较,比如用朴素贝叶斯去做垃圾邮件的分类,我们只需要知道联合概率就可以啦,因为归一化的参数比较项的分母相同,比较过程中可以简化计算。好了,我们现在去想一想联合概率的事情,这里引入我们第三个问题,因为我们统计的概率常常是有限的,那么我们就需要通过概率推理去完成我们的概率计算。比如联合概率P(AB) = P(A|B)P(B) = P(B|A)P(A),根据上式计算可以得出联合概率。

现在考虑一个题外话,前天勇士4:1骑士,赢得2017NBA总决赛冠军。你问一个人,你觉得谁会赢,你愿意花多少钱去赌?为什么每人对这个概率的看法不一样呢?这里我理性的分析一波,首先我们每个人有很多关于这个判决的相关信息,比如常规赛胜利,伤病情况,巨星状态。我们有很多很多概率,我们是怎么用到一起的呢?这里非常复杂,并不是一个简单的条件概率,然是一张复杂交错的网,昨天学习了《离散动态贝叶斯网络推理及其应用》,我稍微有了一点感觉,我们需要用一张贝叶斯网络去描述这些东西,我们去统计一些比较简单的概率,然后使用一套算法去计算相关概率的推导,最终得出决策,这里是另一块贝叶斯网络的内容,设计到很多概率推理的假设和处理,这里只是提一下,有机会后续专门写一篇来介绍这个问题。

问题3

好了,现在我们其实已经中P(A|B)P(B) = P(B|A)P(A)这个式子中能够推出贝叶斯公式了。其实就是一个联合概率的推导,下面公式中分母运用了全概率公式。思路比较简单了,有些概率我们不知道,我们需要利用相关概率来推导。这里P(B)叫做先验概率,就是事先知道的概率。P(A|B)叫似然概率,我觉得这个就是个证据,我们引入A,看起来好像很有道理,就叫似然吧。下面的分母其实是一个归一化。P(B|A)叫做后验概率。很多时候只求联合概率(分子部分)用来比较两个概率的大小。
这里写图片描述
这里我想提一下我对问题3的理解,其实P(A|B)和P(B|A)是没有多大关系的,比如你知道每个非洲人都是黑的(假设的),但是你并不能说每个黑人都是非洲人。因为你看到得并不全,这也是我认为人思维过程中的一个主观误区,我们常常拿似然度直接去描述后验概率,比如我们觉得狼人杀中一个人每次拿狼都上警,但是其实他不拿狼也会上,你就不能说他上警了就是狼。

总结

  1. 概率事件一定要知道样本空间,我们要学会去划分,这个划分在满足互斥的情况下是可以根据我们关注点变化的(不一定要求不可再分)。
  2. 条件概率是一个新的概率率,我们需要重新去划分样本空间和事件,往往我们需要去考虑联合事件。
  3. 条件概率不好求时,概率推导用到了贝叶斯公式,注意贝叶斯公式先验概率和后验概率是因为引入了似然,并做了归一化。似然概率并不能直接反映后验概率!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值