统计学——独立性与相关性检验

本文是贾俊平《统计学》第六版读书笔记,重点探讨了分类数据的χ2统计量,包括拟合优度检验、独立性检验和相关测量。通过实例解析了χ2在泰坦尼克号存活率与性别的相关性检验,展示了如何计算χ2统计量并判断变量间关系的显著性。此外,还简述了方差分析的步骤和关系强度的测量。

统计学(第6版) 贾俊平 读书笔记

第9章 分类数据分析

9.1 分类数据与χ2统计量

统计数据的类型有分类数据、顺序数据和数值型数据。分类数据是对事物进行分类的结果。例如在泰坦尼克号海难的例子中,船上共2208人,其中男性1738人,女性470人。这里,性别是分类变量,有两个类别:男性和女性,男性和女性的人数都是事件结果,以频数的方式表现。χ2检验是对分类数据的频数进行分析的统计方法。

χ2可以用于测定两个分类变量之间的相关程度。若用fo表示观察值频数,用fe表示期望值频数,则χ2统计量可以写为:
在这里插入图片描述
χ2统计量有如下特征:首先,χ2 ≥ 0,因为它是对平房结果的汇总;其次,χ2统计量的分布与自由度有关;最后,χ2统计量描述了观察值与期望值的接近程度。两者越接近,计算出的χ2越小。χ2检验真是通过对χ2的计算结果与χ2分布中的临界值进行比较,做出是否拒绝原假设的统计决策。
卡方分布形状与自由度的关系
自由度越小,分布就越向左倾斜,随着自由度的增加,χ2分布的倾斜程度趋于缓解,χ2分布将趋近于对称的正态分布。利用χ2统计量,可以对分类数据进行拟合优度检验和独立性检验。

9.2 拟合优度检验

拟合优度检验是根据总体分布状况,计算出分类变量中各类别的期望频数,与分布的观察频数进行对比,判断期望频数与观察频数是否有显著差异,从而达到对分类变量进行分析的目的。

例题:
1912年4月15日,豪华巨轮泰坦

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值