生成模型是所有变量的全概率模型:
全概率公式:
举例:一个村子,有三个小偷,A1=A_1=A1=小张,A2=A_2=A2=小政,A1=A_1=A1=小英,两两互斥,求P(B)=P{失窃}P(B)=P\{失窃\}P(B)=P{失窃}
分析:给出A1,A2,A3A_1,A_2,A_3A1,A2,A3,若A1∪A2∪A3A_1\cup A_2\cup A_3A1∪A2∪A3和AiAj=∅,i≠jA_iA_j=\varnothing,i \neq jAiAj=∅,i=j,称作完备事件组
分成两个阶段:1.选人,2.去偷
则P(B)=P(BΩ)=P(B∩(A1∪A2∪A3))=P(BA1∪BA2∪BA3)=P(BA1)+P(BA2)+P(BA3)=P(A1)P(B∣A1)+P(A2)P(B∣A2)+P(A3)P(B∣A3)P(B)=P(B\Omega)=P(B\cap(A_1\cup A_2\cup A_3))=P(BA_1 \cup BA_2 \cup BA_3)=P(BA_1)+P(BA_2)+P(BA_3)=P(A_1)P(B|A_1)+P(A_2)P(B|A_2)+P(A_3)P(B|A_3)P(B)=P(BΩ)=P(B∩(A1∪A2∪A3))=P(BA1∪BA2∪BA3)=P(BA1)+P(BA2)+P(BA3)=P(A1)P(B∣A1)+P(A2)P(B∣A2)+P(A3)P(B∣A3)
故 P(B)=∑i=1nP(Ai)P(B∣Ai)P(B)=\sum\limits_{i=1}^{n}P(A_i)P(B|A_i)P(B)=i=1∑nP(Ai)P(B∣Ai)
判别模型是在给定观测变量值前提下目标变量条件概率模型:
P(Ai∣B)P(A_i|B)P(Ai∣B)
独立事件的解释:
独立的条件:如A1,A2,A3A_1,A_2,A_3A1,A2,A3
有以下条件:
1.P(A1A2)=P(A1)P(A2)P(A_1A_2)=P(A_1)P(A_2)P(A1A2)=P(A1)P(A2)
2.P(A1A3)=P(A1)P(A3)P(A_1A_3)=P(A_1)P(A_3)P(A1A3)=P(A1)P(A3)
3.P(A2A3)=P(A2)P(A3)P(A_2A_3)=P(A_2)P(A_3)P(A2A3)=P(A2)P(A3)
4.P(A1A2A3)=P(A1)P(A2)P(A3)P(A_1A_2A_3)=P(A_1)P(A_2)P(A_3)P(A1A2A3)=P(A1)P(A2)P(A3)
满足1,2,3就是两两独立,全满足就是互相独立
贝叶斯公式举例:(逆概公式)
若B发生了(执果索因),如两个箱子,一个里面只有黑球,一个里面只有白球,概率都是1/2,但是取球,取到黑球,那概率就变成了1和0,就这是贝叶斯修正
P(Aj∣B)=P(AjB)P(B)=P(Aj)P(B∣Aj)∑i=1nP(Ai)P(B∣Ai)P(A_j|B)=\frac{P(A_jB)}{P(B)} = \frac{P(A_j)P(B|A_j)}{\sum\limits_{i=1}^{n}P(A_i)P(B|A_i)}P(Aj∣B)=P(B)P(AjB)=i=1∑nP(Ai)P(B∣Ai)P(Aj)P(B∣Aj)
举例:
设有甲和乙两名运动员,甲命中射击的概率为0.6,乙的威0.5,求下列概率:
1.从甲乙中任选一个人去射击,若目标命中,则是甲命中的概率是多少
2.甲乙各自独立射击,若目标命中,则是甲命中的概率是多少
1.分阶段:(1)选人:A甲,A乙A_甲,A_乙A甲,A乙.(2)射击:命中=BBB
p(A甲∣B)=P(A甲B)P(B)=P(A甲)P(B∣A甲)P(B)=P(A甲)P(B∣A甲)P(A甲)P(B∣A甲)+P(A乙)P(B∣A乙)=12∗0.612∗0.6+12∗0.5=611p(A_甲|B)=\frac{P(A_甲B)}{P(B)}=\frac{P(A_甲)P(B|A_甲)}{P(B)}=\frac{P(A_甲)P(B|A_甲)}{P(A_甲)P(B|A_甲)+P(A_乙)P(B|A_乙)}=\frac{\frac{1}{2}*0.6}{\frac{1}{2}*0.6+\frac{1}{2}*0.5}=\frac{6}{11}p(A甲∣B)=P(B)P(A甲B)=P(B)P(A甲)P(B∣A甲)=P(A甲)P(B∣A甲)+P(A乙)P(B∣A乙)P(A甲)P(B∣A甲)=21∗0.6+21∗0.521∗0.6=116
2.不分阶段
A甲=A_甲=A甲={甲命中}
A乙=A_乙=A乙={乙命中}
B=B=B={目标被命中}
B=A甲∪A乙B=A_甲 \cup A_乙B=A甲∪A乙 甲或者乙命中
p(A甲∣B)=P(A甲B)P(B)=P(A甲)P(A甲)+P(A乙)−P(A甲A乙)p(A_甲|B)=\frac{P(A_甲B)}{P(B)}=\frac{P(A_甲)}{P(A_甲)+P(A_乙)-P(A_甲A_乙)}p(A甲∣B)=P(B)P(A甲B)=P(A甲)+P(A乙)−P(A甲A乙)P(A甲)
极大似然估计:离散型和连续性,即L(θ)={∏i=1np(Xi,θ)∏i=1nf(Xi,θ)L(\theta)=\begin{cases}\prod\limits_{i=1}^n p(X_i,\theta)\\\prod\limits_{i=1}^n f(X_i,\theta)\end{cases}L(θ)=⎩⎪⎨⎪⎧i=1∏np(Xi,θ)i=1∏nf(Xi,θ),当θ\thetaθ取多少时,概率最大
举例:运动员射箭,运动员分1和2级运动员,射箭成绩为(10,9,10,10)(10,9,10,10)(10,9,10,10),所以我们可以推测这个是1级运动员,换句话说,在他为1级运动员时,射出(10,9,10,10)(10,9,10,10)(10,9,10,10)的成绩的概率最大,即p(10,9,10,10∣1)=maxp(10,9,10,10 | 1)=\maxp(10,9,10,10∣1)=max,就是参数为多少时,观测值出现的概率最大,p(10,9,10,10∣?)=maxp(10,9,10,10 | ?)=\maxp(10,9,10,10∣?)=max,???处就是我们要算的θ\thetaθ.
计算步骤: 一般取对数,令dlogL(θ)dθ=0\frac{d\log L(\theta)}{d\theta}=0dθdlogL(θ)=0,得出θ^\hat\thetaθ^,此处log\loglog就是ln\lnln,取对数为什么可以求出θ^\hat\thetaθ^,是因为对数函数严格单调增;也可以不取对数,直接求导;如果L(θ)L(\theta)L(θ)关于θ\thetaθ单调,直接定义法,取两端,一般是样本的max\maxmax或者minminmin。Notice:对于连续性的,要根据分布函数先求出概率密度,XXX ~ F(x,θ)F(x,\theta)F(x,θ)求导得XXX ~ f(x,θ)f(x,\theta)f(x,θ)