频率学派和贝叶斯学派置信区间/可信区间的区别

原创已于 2025-05-11 16:01:39 修改 · 1k 阅读

·

6

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2025-05-11 15:42:23 首次发布

统计同时被 2 个专栏收录

4 篇文章

订阅专栏

2 篇文章

订阅专栏

频率主义（Frequentist）和贝叶斯主义（Bayesianism）是统计推断中两种主要范式，它们在参数估计、假设检验和置信区间的解释上存在根本差异

1. 参数的本质

频率主义：
参数（如均值、方差）被视为固定但未知的常量。数据是随机的，置信区间是通过重复抽样构造的。
贝叶斯主义：
参数是随机变量，具有自身的概率分布（先验分布 + 数据 → 后验分布）。参数的区间估计基于后验分布。

2. 置信区间 vs. 可信区间

频率主义的置信区间（Confidence Interval, CI）

定义：
在重复抽样下，构造的区间有特定概率（如95%）包含真实参数。例如：“95%置信区间"意味着如果重复实验100次，大约95次构造的区间会覆盖真实参数。
注意：不能直接说"参数有95%概率落在当前区间内”（因为参数是固定值，要么在区间内，要么不在）。
计算方式：
基于抽样分布（如正态分布、t分布）。例如：
$CI=θ^±zα/2⋅SE(θ^)\text{CI} = \hat{\theta} \pm z_{\alpha/2} \cdot \text{SE}(\hat{\theta})$

贝叶斯的可信区间（Credible Interval, CrI）

定义：
基于后验分布，直接给出参数落在某个区间的概率。例如："95%可信区间"意味着参数有95%概率位于该区间内。
关键区别：允许对参数做概率性陈述（因为参数是随机的）。
计算方式：
从后验分布的分位数中提取。例如：
若后验分布是 $N(μpost,σpost2)N(\mu_{\text{post}}, \sigma_{\text{post}}^2)$ ，则95% CrI为：
$μpost±1.96⋅σpost\mu_{\text{post}} \pm 1.96 \cdot \sigma_{\text{post}}$

3. 关键差异总结

方面	频率主义（CI）	贝叶斯主义（CrI）
参数性质	固定常量	随机变量
区间解释	重复抽样下的覆盖概率	参数的后验概率
依赖信息	仅依赖观测数据	依赖数据 + 先验分布
计算复杂度	通常解析解或渐近近似	可能需MCMC等数值方法（复杂模型）
主观性	无（除非选择模型/显著性水平）	需选择先验（可能引入主观性）

4. 举例说明

场景：估计正态分布的均值 $μ\mu$ （方差已知）。

频率主义：
计算95% CI为 $xˉ±1.96⋅σ/n\bar{x} \pm 1.96 \cdot \sigma/\sqrt{n}$ ，解释为"在无限次重复抽样中，95%的此类区间会包含真实 $μ\mu$ "。
贝叶斯主义：
假设先验 $μ∼N(μ0,τ2)\mu \sim N(\mu_0, \tau^2)$ ，后验分布为 $N(μ0/τ2+nxˉ/σ21/τ2+n/σ2,11/τ2+n/σ2)N\left(\frac{\mu_0/\tau^2 + n\bar{x}/\sigma^2}{1/\tau^2 + n/\sigma^2}, \frac{1}{1/\tau^2 + n/\sigma^2}\right)$ ，从中提取95% CrI。

5. 争议与选择

频率主义的局限：
无法直接量化参数的不确定性（只能描述数据生成过程）。
贝叶斯的挑战：
先验的选择可能影响结果（尤其数据量小时）；计算可能复杂。
实际应用：
频率主义更常用于传统科学领域（如医学）；贝叶斯在机器学习、小样本问题中优势显著。

总结

频率主义的置信区间反映的是数据的变异性，而贝叶斯的可信区间反映的是参数的不确定性。两者回答不同的问题，选择取决于研究目标和对先验信息的接受程度。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。