回归模型中的误差处理与RELR方法解析
1. 常见回归模型的误差问题
在回归分析中,误差是一个不可忽视的问题。分布误差可能会导致某些类型变量(如价格)出现错误的符号。在离散选择模型中,probit计算潜在地允许随时间相关的误差,但这种计算很复杂,因此研究人员最近在probit模型中通常假设误差随时间是独立的。
而混合logit模型虽然不需要像假设误差不独立的其他模型那样进行更复杂的特殊计算,但它是一个随机效应模型,需要与上述相同的假设,并且要求研究人员指定一个概率分布来描述误差。混合logit模型被认为最适合高质量数据,通常是实验数据。此外,混合logit模型有一长串模型规格需要研究人员控制,这些规格会对模型质量产生很大影响,并且可能受到人为偏差的影响。
在标准逻辑回归中,未观察到的因素产生的序列相关性可以在具有完全独立观测值的模型中正确建模。例如,引入一个二元因变量结果作为前一个观测值的预测变量,在生物统计学文献中,这类模型被称为过渡模型。不过,这些过渡模型无法像随机对照实验中对实验操纵因素那样进行高度控制。即使在离散选择实验的最可控情况下,如果想避免未观察到的因素,也可能需要依赖一些控制程度较低的观测因素。而且,未观察到的因素导致的误差只是众多可能影响模型质量的测量误差之一。
2. 标准回归模型的局限性
在线性回归研究中,长期以来一直在关注自变量和因变量测量误差的影响。多年前,变量误差问题就被扩展到了逻辑回归中。研究表明,在现实场景中,当因变量和自变量都存在测量误差且存在未观察到的效应时,即使考虑的约束条件确定且观测值独立,标准线性和逻辑回归模型也会产生有偏差的回归系数,这些系数不能反映真实的回归系数,且增大样本量也无法缓解这种偏差
超级会员免费看
订阅专栏 解锁全文
18

被折叠的 条评论
为什么被折叠?



