概率论基础、朴素贝叶斯、贝叶斯统计、MLE及贝叶斯网络

趁着这几天在复习数据挖掘,里面牵扯到了一些概率论里面的基础常识,我就简单介绍下有关的基础知识吧!
概率论是一门研究随机现象数量规律的学科,个体选择是有各种各样的原因,微观层面难以准确判断,但从宏观层面,群体角度会涌现出一定的规律,并且这个规律在一定时期内保持不变,概率是帮助我们找到这样规律的一种数学方法。

一. 基本概念

1. 决定性现象和不确定现象

决定性现象包括必然事件和不可能事件;必然事件是指在一定条件下,必然会发生的事情;而不可能事件是指在一定条件下,必然不会发生的事件。
而现实世界中还存在着大量的非决定性现象,比如同一个仪器多次称量同一个物体的重量,所得结果总是略有差异。这种不确定现象也称为随机现象。

2. 随机实验

正如前面所讲,个体选择有各种各样的原因,但如果重复多次实验,群体角度来讲会涌现出一定的规律,所以我们引入了随机实验,即在相同条件下重复进行某项实验,企图从中发现某种规律。随机试验的结果是未知的,它的所有可能结果的集合构成样本空间,试验的每一个可能结果称为样本点,即为 S = { e } S=\left\{ e \right\} S={ e}

3. 随机事件

试验E的样本空间S的子集称为试验的随机事件,简称事件,在每次试验中,当且仅当这一子集中的一个样本点出现时,称这一事件发生。
事件的运算满足交换律、结合律、分配律和德-摩根定律:
在这里插入图片描述
举个例子,在1-2000的整数中随机地取一个数,问取到的整数即不能被6整除又不能被8整除的概率是多少?

解:设事件A代表1-2000的整数中可以被6整除的概率,事件B代表1-2000的整数中可以被8整数的概率,那么即不能被6整数又不能被8整除的事件就是 A ˉ B ˉ \bar{A}\bar{B} AˉBˉ ,即能被6整除又能被8整除的事件就是AB,于是有:
P ( A ˉ B ˉ ) = P ( A ∪ B ˉ ) = 1 − P ( A ∪ B ) = 1 − { P ( A ) + P ( B ) − P ( A B ) } P(\bar{A}\bar{B})=P(\bar{A\cup B})=1-P(A\cup B)=1-\left \{ P(A)+P(B)-P(AB) \right \} P(AˉBˉ)=P(ABˉ)=1P(AB)=1{ P(A)+P(B)P(AB)}
又 333 &lt; 2000 6 &lt; 334 , 2000 8 = 250 , 83 &lt; 2000 24 &lt; 84 , 故 有 : P ( A ) = 333 2000 , P ( B ) = 250 2000 , P ( A B ) = 83 2000 又 333&lt;\frac{2000}{6}&lt;334,\frac{2000}{8}=250,83&lt;\frac{2000}{24}&lt;84,故有: P(A)=\frac{333}{2000},P(B)=\frac{250}{2000},P(AB)=\frac{83}{2000} 333<62000<334,82000=250,83<242000<84,P(A)=2000333,P(B)=2000250,P(AB)=200083

P ( A ˉ B ˉ ) = 1 − ( 333 2000 + 250 2000 − 83 2000 ) = 3 4 P(\bar{A}\bar{B})=1-(\frac{333}{2000}+\frac{250}{2000}-\frac{83}{2000})=\frac{3}{4} P(AˉBˉ)=1(2000333+2000250200083)=43

4. 概率与频率

对于一个随机事件A(除必然事件和不可能事件外 )来说,它在一次试验中可能发生,也可能不发生,我们希望知道的是事件在一次试验中发生的可能性,于是我们用一个数 P(A)来表示该事件发生的可能性大小,这个数 P(A) 就称为随机事件A的概率。那么概率如何计算呢?

这就要引入频率的概念了,在相同的条件下,进行了n次试验,在这n次试验中,事件A发生的次数 n A n_{A} nA称为事件A发生的频数。比值 n A / n n_{A}/n nA/n称为事件A发生的频率,并记为 f n ( A ) f_{n}(A) fn(A)
频数稳定性:大量试验证实,当重复实验次数逐渐增大时,频率呈现出稳定性,逐渐稳定于某个常数,即当n足够大时, f n ( A ) ≈ P ( A ) f_{n}(A)\approx P(A) fn(A)P(A) ,即只要试验次数足够多,我们就可以用频率来估计概率值。

5. 条件概率

设A、B是两个事件,且 P ( A ) &gt; 0 P(A)&gt;0 P(A)>0 ,称 P ( B ∣ A ) = P ( A B ) P ( A ) P(B|A)=\frac{P(AB)}{P(A)} P(BA)=P(A)P(AB) 为在事件A发生的条件下事件B发生的条件概率。

那么现在我们来考虑一个问题,假设有n个条件 A 1 A 2 . . . A n A_{1}A_{2}...A_{n} A1A2...An 推出事件B,如何计算 P ( B ∣ A 1 A 2 . . . A n ) P(B|A_{1}A_{2}...A_{n}) P(BA1A2...An) ?

乘法定理:设 P ( A ) &gt; 0 P(A)&gt;0 P(A)>0 ,则有 P ( A B ) = P ( B ∣ A ) P ( A ) P(AB)=P(B|A)P(A) P(AB)=P(BA)P(A) ,这个式子就是乘法公式,它可以由上面条件概率的公式直接推得。同理,如果有 P ( B ) &gt; 0 P(B)&gt;0 P(B)>0 ,则有 P ( A B ) = P ( A ∣ B ) P ( B ) P(AB)=P(A|B)P(B) P(AB)=P(AB)P(B) ,可以将乘法定理推广到任意n个事件之交的场合:设 A 1 , A 2 , . . . , A n A_{1},A_{2},...,A_{n} A1,A2,...,An 为n个事件, n ≥ 2 n\geq 2 n2 P ( A 1 A 2 . . . A n − 1 ) &gt; 0 P(A_{1}A_{2}...A_{n-1})&gt;0 P(A1A2...An1)>0 ,则有 P ( A 1 A 2 . . . A n ) = P ( A n ∣ A 1 A 2 . . . A n − 1 ) P ( A n − 1 ∣ A 1 A 2 . . . A n − 2 ) . . . P ( A 2 ∣ A 1 ) P ( A 1 ) P(A_{1}A_{2}...A_{n})=P(A_{n}|A_{1}A_{2}...A_{n-1})P(A_{n-1}|A_{1}A_{2}...A_{n-2})...P(A_{2}|A_{1})P(A_{1}) P(A1A2...An)=P(AnA1A2...An1)P(An1A1A2...An2)...P(A2A1)P(A1)

条件概率 P ( A ∣ B ) P(A|B) P(AB) 与积事件概率 P ( A B ) P(AB) P(AB) 的关系: P ( A B ) P(AB) P(AB)是在样本空间S内事件AB发生的概率,而 P ( A ∣ B ) P(A|B) P(AB)是在试验E增加了新条件B发生后的缩减样本空间 S B S_{B} SB 中计算事件A的概率。虽然都是A、B同时发生,但是两者是不相同的,有 P ( A B ) = P ( B ∣ A ) P ( A ) P(AB)=P(B|A)P(A) P(AB)=P(BA)P(A) ,仅当 P ( S ) = P ( B ) = 1 P(S)=P(B)=1 P(S)=P(B)=1 时两者相等。

6. 全概率公式

全概率公式是概率论中的一个重要公式,应用全概率公式的关键是建立样本空间的正确划分(即构造一个正确的完备事件组),然后计算各个概率和条件概率,最后代入全概率公式。它是求复杂事件概率的有力工具。
样本空间的划分定义:设S为试验E的样本空间, B 1 , B 2 , . . . , B n B_{1},B_{2},...,B_{n} B1,B2,...,Bn 为E的一组事件。若满足(1) B i B j = ∅ , i ≠ j , i , j = 1 , 2 , . . . , n B_{i}B_{j}=\varnothing ,i\ne j,i,j=1,2,...,n BiBj=,i̸=j,i,j=1,2,...,n;(2) B 1 ∪ B 2 ∪ . . . ∪ B n = S B_{1}\cup B_{2} \cup ... \cup B_{n}=S B1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值