- 总体信息:总体分布或总体所属分布簇提供的信息
- 样本信息:从总体中抽取出的样本提供的信息
- 先验信息:在抽样之前对事件的认知,主要来源于经验和历史资料
- 经典统计学:基于总体信息和样本信息;未知量是固定的未知常数
- 贝叶斯统计学:在总体信息和样本信息的基础上,引入先验信息;未知量是一个随机变量
- 先验分布:使用先验信息加工(计算)得到的分布,描述抽样前未知量的未知状况
- 后验分布:使用总体信息、样本信息和先验信息加工(计算)得到的分布,更新对未知量的认知状况。
1.贝叶斯公式
- 后验概率P(A|B):在事件B发生的情况下,事件A发生的概率
- 先验概率P(A):事件A发生的概率
- P(B|A):在事件A发生的情况下,事件B发生的概率
- P(AB)=P(B|A)P(A):事件A和事件B同时发生的概率
- P(B):事件B发生的概率
2.贝叶斯公式的一般形式
- 假设随机变量X的总体分布依赖于参数θ,在贝叶斯统计中,其密度函数记为 p(x|θ)
- 根据参数θ的先验信息确定其先验分布 π(θ)
- 假设给定参数 θ=θ',由此可从总体分布 p(x|θ') 中产生样本 x=(x1,...,xn),样本的联合密度函数(似然函数)为
。现在,不给定参数 θ,结合 θ 的先验分布,得到样本 x 和参数 θ 的联合密度函数 h(x,θ)=p(x|θ)π(θ)。
- 样本 x 的边缘密度函数
,表示样本 x 在整个参数 Θ 空间上发生的概率。
- 综合可得,贝叶斯公式的一般形式:
- π(θ|x)是参数 θ 的后验分布( 对应后验概率P(A|B) ),π(θ)是参数 θ 的先验分布(对应先验概率 P(A) ),p(x|θ)(对应 P(B|A) ),m(x) (对应 P(B) )
- 公式综合了总体信息(事先假设总体分布形式)、样本信息(似然函数、边缘米杜安函数)、先验信息(参数的先验分布)
- 离散形式:
3.后验分布的计算
为研究产品质量,我们从一批产品中抽取 8 个产品进行检验,结果发现 3 个不合格品。现设θ是这批产品的不合格率,并且先验分布有两种情形:
(1), (2)
试分别求θ的后验分布。下面以(1)为例。
Step 1:写出先验分布、总体分布的密度函数,样本的联合密度函数
Step 2:计算样本和参数的联合密度函数h(x,θ)
Step 3*:计算样本的边缘密度函数m(x)
在计算积分部分时,要结合常用概率分布的密度函数。注意到Beta分布的密度函数中与积分部分中的
相似,将积分部分改写成Beta分布密度函数的形式,其在0到1上的积分为1,即可快速计算出m(x)。
Step 4:应用贝叶斯公式求后验分布
已知n=8,x=3,求得θ的后验分布为