数理统计之方差分析及python实现

一、理论学习

1.0、概念

  • 1、方差分析(ANOVA)用于研究一个或多个分类型自变量与一个数值型因变量的关系。方差分析通过检验多个总体(同属于一个大整体)的均值是否相等来判断一个或多个分类型自变量对数值型因变量是否由显著影响。
  • 2、方差分析包含的三个重要概念:(以小学六年级的学习成绩为例)
    • 因子:分类型自变量。例如:六年级的所有班级
    • 水平:某个因子下的不同取值。例如六年级有一班、二班、三班。
    • 观测值:每个因子水平下的样本观测值。例如:六年级三个班各自的学生成绩。

1.1、单因素方差分析

1.1.1、概念理解

  • 1、单因素方差分析就是只有一个因子自变量对因变量的影响。例如,地区差异是否影响农作物的产量,人们的学历对工资收入的影响等。这些问题都可以通过单因素方差分析得到答案。
  • 2、方差分析满足条件
    • 各实验总体均服从正态分布
    • 各实验均独立
    • 方差齐性假设:H0:各实验的总体方差均相等
  • 3、、单因素方差分析步骤:
    • 1、明确观测变量和控制变量。上述问题中的观测变量分别是农作物产量和工资收入;控制变量(自变量)分别为地区和学历。
    • 2、剖析观测变量的方差。方差分析认为:观测变量值的变动会受控制变量和随机变量两方面的影响。据此,单因素方差分析将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分,用数学形式表述为:SST=SSA+SSE。
    • 3、通过比较观测变量总离差平方和各部分所占的比例,推断控制变量是否给观测变量带来了显著影响。
  • 3、总结:在观测变量总离差平方和中,如果组间所占比例较大,则说明观测变量的变动主要是由控制变量引起的;反之,如果组间所占比例小,则说明观测变量的变动不是主要由控制变量引起的,是由随机变量因素引起的。

1.1.2、基本步骤

  • 1、提出原假设:H0: μ 1 \mu_1 μ1= μ 2 \mu_2 μ2=…= μ
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值