非线性效应建模:方法、应用与决策
1. 引言
在实际数据分析中,协变量与结果之间的关系往往并非线性。本文将介绍几种用于建模协变量非线性效应的方法,包括二次回归、多项式回归、样条函数和分数多项式等,并探讨如何根据研究目的选择合适的建模方法。
2. 二次回归
2.1 基本原理
当连续结果变量 (Y) 与协变量 (X) 之间呈现非线性关系时,可通过引入协变量的非线性函数作为额外的协变量来使用回归模型进行分析。最常用的方法是将协变量 (X) 的平方 (X^2) 作为额外协变量,构建二次模型:
(\mu(x) = \beta_0 + \beta_1x + \beta_2x^2)
通过在数据集中创建额外的协变量 (X^2) 并将其纳入模型,即可拟合该二次模型。
2.2 示例分析
以儿童词汇量与年龄的关系为例,拟合二次回归模型后得到如下输出:
| variable | beta | SE | 95%CI | p - value |
| — | — | — | — | — |
| age | -215.591 | 43.923 | [-302.246, -128.936] | <0.001 |
| age2 | 5.770 | 1.072 | [3.655, 7.885] | <0.001 |
从输出结果来看,年龄的系数为负,但实际年龄与词汇量呈正相关。线性项“age”的 (p) 值通常不太有用,因为它检验的是无线性项的二次模型的原假设;而二次项的 (p) 值易于解释,它检验的是真实模型为简单线性模型的原假设。
超级会员免费看
订阅专栏 解锁全文

1186

被折叠的 条评论
为什么被折叠?



