测量误差对回归分析结果的影响
在回归分析中,测量误差或协变量值的错误分类是一个常见问题。它可能会对分析结果产生显著影响,下面我们详细探讨这方面的内容。
1. 系统和随机测量误差的影响
在医学研究中,大多数连续协变量的测量都存在一定的误差。例如,血压测量会受到测量设备和测量条件的影响,而且血压在一天中并非固定不变,还需考虑生物变异因素。此外,如果依赖受试者提供的信息来测量某个变量,可能会因受试者记忆能力有限或故意操纵而产生测量误差。
1.1 随机测量误差
随机测量误差可表示为测量的协变量值 (X = X^ + \varepsilon),其中 (X^ ) 是协变量的真实值,(\varepsilon) 是期望值为 0 的随机测量误差。当 (Y) 与 (X) 存在正相关时,回归斜率会变小;当为负相关时,斜率的绝对值也会变小,即都存在向 0 偏移的偏差,这种现象也被称为回归稀释。
以下是其影响的简单示例说明:
|情况|对回归斜率的影响|
| ---- | ---- |
|正相关|变小|
|负相关|绝对值变小,向 0 偏移|
1.2 系统测量误差
测量误差的均值不一定为 0,通常还存在系统成分。例如,实验室参数的测量可能总是比真实值高 0.2mg/l,这种固定偏差对回归斜率无影响。但如果系统误差的大小取决于 (X) 的值,情况就不同了。比如高收入者倾向于少报收入,低收入者倾向于多报收入,这种误差会使回归斜率变陡,产生偏离 0 的偏差;反之,如果大值高估、小值低估,则会产生向 0 的偏差。
下面用 mermaid 流程图说明随
超级会员免费看
订阅专栏 解锁全文
5万+

被折叠的 条评论
为什么被折叠?



