回归建模策略与Cox比例风险模型解析
1. 有序分类协变量的处理
在数据分析中,有序分类协变量的处理是一个关键问题。当遇到有序分类的协变量时,通常会期望结果随类别水平的变化而增加或减少,即存在一种趋势关系。
1.1 两种处理方式
- 将有序类别视为连续变量 :可以将类别编码为1, 2, 3, …,然后将该协变量当作连续变量处理。但这种方法隐含了一个先验假设,即相邻类别之间的差异相等,这是一个较强的线性趋势假设。例如,在分析社会阶层这一协变量时,如果将其作为连续变量,可能会丢失一些信息,因为它只能得到一个效应估计值。
- 将有序类别视为普通类别 :这种方式的优点是可以避免线性趋势假设,深入了解这些差异的真实大小。比如在分析社会阶层时,可能会发现不同阶层之间的差异并不相等。
1.2 两种处理方式的效果对比
以社会阶层作为协变量,以身体质量指数作为结果的数据集为例,进行两种分析:
|分析方式|β估计值|95%置信区间|p值|
| ---- | ---- | ---- | ---- |
|将社会阶层作为分类协变量|II与I对比:0.81
III与II对比:0.96|II与I对比:[-0.78, 2.41]
III与II对比:[-0.63, 2.55]|0.099|
|将社会阶层作为连续协变量|0.89|[0.09, 1.68]|0.031|
从上述表格可以看出,将社会阶层作为连续协变量时,置信区间更窄,p值更小。这是因为在处理社会阶层作为连续协
超级会员免费看
订阅专栏 解锁全文
541

被折叠的 条评论
为什么被折叠?



