电子健康记录数据库数据模型的适用性分析
电子健康记录(EHR)数据库由于其数据的稀疏性、易变性和异构性,需要合适的数据模型来支持各种数据库功能。本文将对几种常见的数据模型进行详细介绍和比较分析。
电子健康记录数据的特点
电子健康记录数据具有异构性,即包含多种数据类型。其内容可以是结构化、半结构化或非结构化的,或者是三者的混合。具体的数据类型包括纯文本、编码文本、段落、测量值(带数值和单位)、日期、时间、日期 - 时间(及部分日期/时间)、封装数据(多媒体、可解析内容)、基本类型(如布尔值、状态变量)、容器类型(列表、集合)和统一资源标识符(URI)。
为了应对电子健康记录数据的稀疏性、易变性和异构性问题,出现了几种著名的数据模型,包括实体 - 属性 - 值(EAV)模型、动态表(Dynamic Tables)、优化实体 - 属性 - 值(OEAV)模型和优化列导向模型(OCOM)。
实体 - 属性 - 值(EAV)模型
- 模型结构 :EAV 是一种基于行的模型,与关系模型不同,它将每个属性的值存储在一行中。每行由三元组“实体(Entity)”、“属性(Attribute)”和“值(Value)”组成。“实体”用于唯一标识存储数据的实体;“属性”表示对应每个实体的不同列名;“值”表示该实体特定属性的值。
- 与关系模型对比 :关系模型将整个属性值存储在一个专用列中,而 EAV 模型为每个列值创建一行。例如,关系模型中的一行若有四个属性,在 EAV 模型中会拆分为四行。并且,EAV 模型不会为关系模型中包含空值的属性创建行,因为它只指
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



