时间序列回归与指数对数知识解析
1. 时间序列回归概述
时间序列回归主要用于结果为连续变量,且与预测变量随时间顺序测量的情况。其中,中断时间序列是较为实用的例子。当干预措施在整个区域实施时,评估该干预的唯一方法是比较干预前后的结果,这类模型也被称为不连续模型。
时间序列回归涉及因变量和自变量随时间测量的情况。通常只有一个包含一个因变量和多个自变量的单一序列,这与重复测量可能有多个数据序列不同。
时间序列回归中存在较高的混杂可能性,许多变量会随时间简单地增加或减少,因此会随时间相关。此外,许多流行病学变量具有季节性,即使这些因素没有因果关系,这种变化也会存在。所以,正确考虑季节性和趋势非常重要。例如,婴儿猝死在冬季比夏季更常见,但这并不意味着温度是一个因果因素,还有许多其他因素可能影响结果,如日照减少或病毒存在。然而,如果意外寒冷的冬天与婴儿猝死增加相关,或者非常寒冷的日子在短时间后持续伴随着每日婴儿猝死率上升,那么可能推断出因果关系。
当正确考虑混杂因素时,残差的序列相关性通常会消失。残差看似序列相关是因为与时间相关的预测变量有关,在该变量的条件下,残差是独立的。对于死亡率数据尤其如此,除了流行病期间,个体死亡是无关的。因此,通常可以使用常规回归方法,然后检查残差的序列相关性,只有在有明确证据表明缺乏独立性时才进一步处理。
如果纳入已知或潜在的混杂因素未能消除残差的序列相关性,那么普通最小二乘法无法提供参数标准误差的有效估计。
中断时间序列或不连续设计是时间序列方法的常见应用,常用于公共卫生领域。当干预措施影响整个社区时,无法设置同期对照,但可以比较干预前后收集的数据。新冠疫情提供了许多这样的机会。主要问题是干预如何改变