贝叶斯统计基础与应用解析
1. 贝叶斯统计中的先验分布与边际似然
在进行统计分析前,对于运动员击球率 $\theta$ 的分布,我们可以依据先验信息或估计者的信念来确定一个先验分布,记为 $\phi(\theta)$。该分布需满足 $\phi(\theta) \geq 0$ 且 $\int_{\Theta} \phi(\theta)d\theta = 1$,例如均匀分布 $\phi(\theta) = 1$,$0 \leq \theta \leq 1$ 就是一个可接受的先验分布。
以比赛前三轮击球结果为例,击球结果用 1 表示击中,0 表示未击中,那么前三轮击球结果 $(x_1, x_2, x_3)$ 共有 8 种可能:000、001、010、011、100、101、110、111。假设 $x_1, x_2, x_3$ 的出现相互独立,对于参数值 $\theta$,其条件概率为 $p(x_1|\theta)p(x_2|\theta)p(x_3|\theta)$,再乘以先验概率 $\phi(\theta)$ 后,需对 $\theta$ 进行积分,即 $Z(x_1, x_2, x_3) = \int_{\Theta} p(x_1|\theta)p(x_2|\theta)p(x_3|\theta)\phi(\theta)d\theta$,这就是 $(x_1, x_2, x_3)$ 出现的概率,也就是边际似然。
若先验分布为均匀分布,可计算出:
- $Z(0, 0, 0) = \int_{[0,1]} (1 - \theta)^3d\theta = \frac{1}{4}$
- $Z(0, 0, 1) = \int_{[0,1]} (1 - \theta)^2\the
超级会员免费看
订阅专栏 解锁全文
1083

被折叠的 条评论
为什么被折叠?



