对数线性分析全解析:从理论到R语言实践
1. 对数线性分析基础
对数线性分析是卡方检验的扩展,用于分析分类数据。在对数线性分析中,我们从饱和模型开始,逐步移除高阶交互项,以寻找最简约且能良好拟合数据的模型。
在分析过程中,我们会用到似然比统计量来评估每个模型。似然比统计量的计算公式为:
[
\chi^2_{change} = \chi^2_{current\ model} - \chi^2_{previous\ model}
]
饱和模型的似然比统计量总是为0,因为其预期频率与观测频率相同。
2. 对数线性分析的假设
对数线性分析有两个主要假设:
- 每个实体应仅落入列联表的一个单元格,即单元格必须相互独立。
- 预期频率应足够大,以进行可靠的分析。在涉及两个以上变量的对数线性分析中,允许最多20%的单元格预期频率小于5,但所有单元格的预期频率必须大于1。
如果违反了预期频率的假设,会导致检验效力大幅降低。解决预期频率问题的方法有:
1. 合并某个变量的数据(最好是预期影响最小的变量)。
- 最高阶交互项应不显著。
- 涉及要删除变量的至少一个低阶交互项应不显著。
2. 合并某个变量的类别。
3. 收集更多数据。
4. 接受检验效力的损失。
3. 使用R进行对数线性分析
3.1 初始考虑
数据输入方式与卡方检验相同。以猫和狗的示例数据文件 CatsandDogs.dat 为例,加载和打开文件的代码如下:
超级会员免费看
订阅专栏 解锁全文
1136

被折叠的 条评论
为什么被折叠?



