持续因果效应估计:CERL框架解析
1. 研究挑战
在持续治疗效应估计中,现有的因果效应推断方法面临着扩展性、适应性和可访问性等新挑战。即便对现有治疗效应估计方法进行调整以应对这些问题,改进后的方法仍存在不可避免的缺陷。以下是三种直接的调整策略及其问题:
- 直接应用旧模型到新数据 :若直接将基于原始数据训练的模型应用于新的观测数据,由于不同数据源之间存在领域偏移问题,模型在新任务上的表现会很差。
- 利用新数据重新训练旧模型 :利用新数据重新训练之前学习的模型以适应数据分布的变化时,旧知识会被新知识完全或部分覆盖,导致模型在旧任务上的性能严重下降,即“灾难性遗忘”问题。
- 结合新旧数据重新训练模型 :为克服灾难性遗忘问题,可存储旧数据并将新旧数据结合起来,然后从头开始重新训练模型。但这种策略内存效率低、耗时,而且长时间存储数据还会带来版权或隐私等实际问题。
策略 | 问题 |
---|---|
直接应用旧模型到新数据 | 领域偏移导致新任务表现差 |
利用新数据重新训练旧模型 | 灾难性遗忘,旧任务性能下降 |
结合新旧数据重新训练模型 | 内存效率低、耗时,有版权和隐私问题 |