如何理解置信区间

最新推荐文章于 2024-04-16 11:26:31 发布

原创最新推荐文章于 2024-04-16 11:26:31 发布 · 8k 阅读

·

15

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

统计与概率专栏收录该内容

23 篇文章

订阅专栏

博客介绍了点估计与区间估计，以刮刮卡游戏为例说明两者区别。重点讲解置信区间，通过人类身高估计阐述其概念和构造方法。指出置信区间是区间估计的一种，虽不知哪个区间更好，但按其构造的区间有一定概率包含真实值，还提到置信区间要求及置信水平可调整。

置信区间，就是一种区间估计。

先来看看什么是点估计，什么是区间估计。

1 点估计与区间估计

以前很流行一种刮刮卡：

游戏规则是（假设只有一个大奖）：

大奖事先就固定好了，一定印在某一张刮刮卡上
买了刮刮卡之后，刮开就知道自己是否中奖

那么我们起码有两种策略来刮奖：

点估计：买一张，这就相当于你猜测这一张会中奖
区间估计：买一盒，这就相当于你猜测这一盒里面会有某一张中奖

很显然区间估计的命中率会更高（当然费用会更高，因为风险降低了）。

接下来，我们看看置信区间是如何进行区间估计的。

2 置信区间

我们通过对人类身高的估计来讲解什么是置信区间。

2.1 上帝视角

对于人类真实的平均身高，我们是没有办法知道的，因为几乎不可能把每个人都统计到。

但这个数据肯定是真实存在的，我们可以说，上帝知道。

在这里我们引入了上帝视角，即上帝看到的人类身高的真实分布。

假设人类的身高分布服从如下正态分布（）：

也就是说全体人类的平均身高为145cm，为了表示只有上帝可以看到，我把真实分布用虚线来表示：

2.2 点估计

作为愚蠢的人类，我们只能在人群中抽样统计：

比如下面是一次抽样数据，我把算出来的样本均值（记作）画在图上（蓝色的点）：

就是对真实的的一次点估计。

通过一次次的抽样，我们可以算出不同的身高均值的点估计：

如果我们关闭上帝视角，我们分辨不出哪个点估计更好：

区间估计可以改进此问题。

2.3 置信区间

置信区间，提供了一种区间估计的方法。

下面采用置信区间来构造区间估计（什么是置信区间，这个我们后面解释）：

通过置信区间构造出来的区间，我们可以看到，基本上都包含了真实的，除了红色的那根。

关闭上帝视角，我们仍然不知道哪一个区间估计更好：

但是，和点估计比较：

点估计和区间估计，都不知道哪个点或者哪个区间更好
但是，按照置信区间构造出来的区间，随便选一个区间，有的概率会包含

这就好像用渔网捞鱼，我知道每一网下去有的几率捞到想要的那条鱼，但是并不知道是不是现在这一网：

剩下的问题就是置信区间是如何构造的。

3 置信区间

假设人群的身高服从：

其中未知，已知。

我们不断对人群进行采样，样本的大小为，样本的均值：

根据大数定律和中心极限定律，服从：

我们可以算出以为中心，面积为0.95的区间，如下图：

即：

也就是，有的几率落入此区间：

那自然，我们以为半径做区间，有的概率把包含进去：

那么，只有一个问题了，我们不知道、并且永远都不会知道真实的是多少。

我们就只有用来代替：

4 总结

总结一下：

置信区间要求估计量是个常数
也被称为置信水平，是统计中的一个习惯，可以根据应用进行调整

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

马同学图解数学 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。