健康演化信息知识图谱与事件关系表示研究
健康演化信息知识图谱构建
在健康领域,构建健康演化信息数据库是一项重要任务。研究提出了一种知识获取方法,其管道实现包含自动知识组件,如文本分类和补全,同时还引入了人工参与步骤,以从领域专家处获取知识。
从时间成本来看,如果仅使用知识组件提取步骤生成的推荐来填充SNOMED CT,大约需要四年半(55.20人月)。而在另一种情况下,一名参与者每小时平均能进行144次正确标注(每天1008次),完成任务大约需要一年半(19.16人月)。若有多名专家同时参与,任务时间将大幅缩短。例如,七名专家按照第一种情况的工作量,任务大约需要八个月(7.88个月);按照第二种情况,则大约需要三个月(2.73个月),这表明该方法具有可持续性。
此外,还对评分者间的可靠性进行了评估,使用Krippendorff的alpha系数,得出的一致性为0.4685。尽管数据显示参与者对10个概念中的7个有所熟悉,但这一结果仍反映出寻找具有共同专业知识的参与者存在困难。
该研究的主要目标是填补健康状况演变和恢复时间相关资源的知识空白。研究发现,从自然语言中提取健康演化陈述是可行的,推荐信息有助于从专家那里获取知识,利用SNOMED CT的特性可以加速推荐的生成,从而提高其覆盖率。引入人工参与模块是该研究的一个关键优势,用户研究结果表明,将领域专家纳入方法中可以加速知识图谱的构建,更重要的是,能确保获取他们有价值且准确的知识。
事件关系表示研究
在现实世界中,动态环境可以建模为一系列相互作用的事件和事实,这些相互作用具有不同的关系,包括时间和因果关系等。然而,现有的数据模型和数据集在表示事件之间的多种关系类型方面存