自动生成的SNOMED - CT子集的连通性、语义模式及目的地营销的OWL本体开发
1. 自动生成的SNOMED - CT子集的连通性与语义模式分析
在分析自动生成的SNOMED - CT子集时,我们主要从以下几个方面进行研究:
- 限定关系的密度
- 当通过各种关系(IS - A和非IS - A扩展)来扩展子集时,可能会引入一些通用概念或概念类,这些概念与图的其他部分有大量关系,从而使连通性和语义模式的理解变得模糊。例如,限定关系引入了诸如严重程度、病程和发作性等概念,它们与“疾病”这一SNOMED - CT顶级概念下的每个概念都相关。
- 在临床指南中,疾病的细化很常见,但严重程度、病程和发作性这些概念及其与图中其他部分的关系,除了分类之外,并没有提供其他重要信息。而且,这些概念在图中占了很高比例的弧。例如,在经过非IS - A扩展的“帕金森 - 儿童 - H3”子集中,这三个概念占了H3级别每个研究子集中30% - 50%的弧。
- 考虑限定关系还会扭曲子集直径的分析,因为严重程度概念就像一个枢纽,通过两步路径连接每对疾病概念,同时也会影响顶点的平均度。
- 鉴于IS - A关系更适合用于分类目的,本研究在子集分析的图中,仅当通过IS - A也能到达连接的概念时,才包含非IS - A关系。
- 组件数量分析
- 对于有向图G = {V, A},组件是G的最大连通子图。如果子图中的每对顶点都相连,则称该子图是连通的。在有向图中,有强组件(遵循弧的方向)和弱组件(将弧视为无方向的边)的概念,本研究采用弱组件的定义,因为它适合将通过IS - A遍历得到的树识别为单个组件。 <
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



