电子健康推荐系统架构:基于患者症状相似度的创新方案
1. 架构概述
电子健康推荐系统的架构主要依赖于医疗数据源,医生会以诊断、症状、观察等形式将健康记录信息录入其中。除了编码诊断外,这些信息大多以叙述方式呈现,包含了口语化和非正式表达,这给非结构化文本相似度分析带来了挑战。
该架构从异构数据源获取包含电子医疗记录的数据,它仅作为读取者,不能修改原始记录,而是处理格式化和翻译后的记录副本,避免给主系统增加负担。
架构主要由以下几个模块组成:
- 数据收集模块 :通过“数据源管理器”注册数据源,明确其数据结构。“数据抽取器”将数据从原始数据源抽取并转换为组织记忆所需的结构。“收集统计信息”组件收集数据源及其数据的性质信息,以评估数据质量问题。“数据源检查器”决定记录是否纳入组织记忆,若记录包含患者ID、就诊时间戳和症状说明则保留,诊断和治疗字段的缺失是可容忍的,因为可能是新的病症。
- 数据预处理模块 :包含“诊断过滤”组件,用于区分不同类型的诊断,辅助文本相似度分析;“向量化器”将组织记忆记录转换为布尔向量,便于计算度量距离;“缺失值”组件识别有缺失值的记录并提出解决方案;“同质化器”负责将数据源的注册数据结构转换为组织记忆所需的数据结构。
- 案例管理器模块 :管理组织记忆,采用抽样策略处理大量数据,优化数据访问时间并确保统计结果的有效性。
- 查询规划器模块 :由四个组件构成,“查询预处理”负责捕获临时查询、组织查询计划并放入查询队列;“查询管理器”接收并注册计划查询,定期放入查询队列执行
超级会员免费看
订阅专栏 解锁全文
35

被折叠的 条评论
为什么被折叠?



