数据分析师25-统计学知识

why-not？

已于 2022-05-20 15:43:59 修改

阅读量792

点赞数 1

分类专栏：数据分析师感悟文章标签：零售

于 2022-05-14 23:42:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_52373030/article/details/124768826

版权

数据分析师感悟专栏收录该内容

23 篇文章

订阅专栏

本文深入探讨统计学中的假设检验，包括如何衡量数据离散程度、总体均值的区间估计、样本量的确定、Z和T检验的使用场景以及错误类型。此外，还介绍了方差分析（ANOVA）在多组数据比较中的应用，以及F检验判断方差齐性的重要性。最后，提到了卡方检验、层次分析法（AHP）和熵权法在实际问题中的应用，并提供了Excel和Python实现假设检验和方差分析的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

假设检验及例题讲解_学渣渣渣渣渣的博客-优快云博客_假设检验例题

1:如何判断数据的离散程度

2:总体均值的区间估计=平均值+-（z 阿尔法/2）*标准差/根号样本量。（）里面只有小样本且方差未知的情况，我们用t值（n-1）的表，其余都是z检验。

3:根据上面公式误差error=平均值+-（）*标准差/根号样本量。现实中取样本的量肯定不是越多越好涉及到成本，也不能太少，所有会根据我们能接受的error大小反推出样本应该取多少。error一般是10%的误差。

4:假设检验的逻辑是：样本数据估计总体。样本的区间就是平均值+-（z 阿尔法/2）*标准差/根号样本量，如果我们假设的值在这个样本的区间内，那就假设成立了。如果原假设的不在这个区间，那就拒绝原假设。

或者用数学的方式直接告诉你要不要拒绝：把假设的值放到公式里面：

（样本平均值-假设值）/（样本标准差/根号样本量）如果这个Z 阿尔法/2 过大/过小就说明假设值发生的概率很小拒绝。

5:但是由于我们样本可能是不对的，所以

：type 2如果我们要验证的那个值在样本区间反而不应该接受他因为他本来就是错误的求伪

：type 1如果我们要验证的那个值不在样本区间反而不应该拒绝他因为他本来是对的弃真 5%

6:假设验证的应用

：我现在想看我的活动有没有显著提升，也就是想看B组的数据有没有显著高于A（是一个单一数值）怎么看？就是：A的值放进B组平均值和标准差的公式里，求出 Z阿尔法/2 看看是不是过大过小。

7:两个总体之间平均值之差的检验，这个更常用一些（这个公式适用于总体方差已知但是通常不可能知道的！！！所以一般用t检验。！！）

：比如我想比较空白组A和实验组B 想证明实验组B是显著有效果的，要高于空白组A。也就是B做了一些策略，想证明策略是有用的。其实就是比较AB组的平均值是否相等样本数量足够大默认是服从正态分布的。直接放到公式即可：

如果方差未知的话就需要用t检验，！！在t检验之前，需要判断2个总体的方差是否一样？所以涉及到（F检验），如果F检验显示不显著，就一般双样本t检验，如果显著就非参数t检验

：简单的F检验）就是比较两组数据的方差是不是一致的，应用该场景就是评价策略有没有带来影响 AB数据的放出是否显著有差异。

直接算出AB组的方差，一除然后查看看对应n-1正常的范围即可。判断是否显著不同

检验完毕后，才是t检验

：这里补充说明一下区别三种T检验的详细区分_spssau的博客-优快云博客_t检验的三种类型和应用条件

1:独立样本t检验就是一般的检验，用户两组数据的对比。可以用于对照实验，也可以单纯的单因素分析。

2:配对样本检验需是严格条件下的独立样本t检验，需要数据2列一一对应的关系，数量一致，最多用于对照和实验。

3：如果多因素或者多组数据了，那就是方差分析。

4:如果x y 都是定性的那就是卡方检验

8:有难度的F检验：适用于多组数据之间的比较具体应用场景：比如我想看ABCD组数据，每组的数据是否是显著有差异的？？什么意思？？
ABCD组数据可能存在差异是因为有一个变量X因子，F检验（方差分析）的目的就是想证明X 是否对数据有显著影响。多个因素就是方差分析，2个就是F检验或者t检验

ABCD数据有差异=组内误差总和+组外误差总和。如果组外误差/组内误差很大，则说明X因子有显著影响。

比如ABCD每组6个数一共24个数

组内方差总和：（A组每个数- A组平均值）的平方 X 6 + 同理B +C+D

组外：（所有数24个数的平均值- A组平均值）的平方 X 6 （其实就是几个数加几回），+B组同样的计算方式 + C+ D。求和即可。

9:卡方检验，适用的场景也是看 X因子对 A B组数据有没有影响但是和F检验的差别在于：卡方只看最终结果的占比，来判断真实值和理论值之间的差异。比如有4群人

10:AHP层次分析法

层次分析法(AHP) - 知乎

11:熵权法

如何用熵权法计算权重？ - 知乎

12:用excel做假设检验和方差分析

可重复的理解：首先是多维度的，那如果在某个（多维度结合）场景下，样本数据量如多于1组，就代表着样本是重复的，需要对这个特点场景进行一次计算，然后才是组内和组外。

可重复：

无重复：

Excel 如何实现方差分析：单因素、包含重复的双因素、无重复的双因素方差分析_office教程

13:用python做假设检验和方差分析

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。