处理不确定观测时间的模型与算法
在许多实际场景中,标准的时间模型假定观测时间是准确无误的。然而,当涉及人工数据录入时,带有噪声的时间戳极为常见。若直接采用这些时间戳,可能会引发严重问题。本文聚焦于处理观测时间不确定性的建模框架,并介绍了在特定合理假设下具有线性时间复杂度的推理算法。
1. 问题背景
现实世界的随机过程常由离散时间状态空间模型描述,如隐马尔可夫模型(HMM)、卡尔曼滤波器和动态贝叶斯网络。在这些模型里,通常认为观测变量的时间是确定的,观测能准确对应到正确的状态变量。
但实际情况并非如此简单,以重症监护病房(ICU)为例,患者会被多个传感器监测,这些传感器记录的生理变量(如心率、呼吸率、血压)的时间戳是可靠的。然而,ICU护士记录的患者状态(如“烦躁”“咳嗽”等)和事件(如“吸痰”“抽血”“注射去氧肾上腺素”等)的注释,包含了手动报告的事件时间,这个时间可能与实际事件发生时间存在偏差。例如,护士在11:00的报告中称去氧肾上腺素在10:15注射,但实际注射时间是10:05。
这种时间误差若相对于底层过程的时间尺度不可忽略,就会产生严重问题。如去氧肾上腺素是一种速效血管升压药,会在一到两分钟内升高血压。若监测系统直接采用报告的10:15作为注射时间,就需要为10:06时血压的快速上升寻找其他解释(可能导致错误诊断),还可能推断10:15注射的药物并非去氧肾上腺素。此外,观测时间的误差会给学习系统学习动态系统模型带来困难,事件顺序的颠倒也会干扰因果关系或专家政策规则的学习。
类似的带有噪声时间戳的情况还出现在生物实验室的手动数据录入、工业工厂、考勤记录、情报行动和实际战争等场景中。这些场景的共同特点是手动录入的观测序列与时间准确的连
超级会员免费看
订阅专栏 解锁全文
995

被折叠的 条评论
为什么被折叠?



