新冠疫情下知识图谱的构建与应用
1 引言
自2019年底新冠疫情爆发以来,全球研究机构的科研人员不断探索和分享有关新冠病毒和疫情的信息。为了有效组织和分析这些海量信息,超过100万篇关于COVID - 19、SARS - CoV - 2和冠状病毒的学术文章被收集到公开的COVID - 19开放研究数据集(CORD - 19)中。随着研究活动和科学出版物的增加,该数据集迅速增长,给全面高效分析带来挑战。此时,知识图谱作为一种图基模型,相较于传统的关系模型和非关系替代方案,在表示与COVID - 19相关的复杂知识方面具有显著优势。
知识图谱能够将相关实体的语义信息进行组织和表示,以节点和边的互连形式呈现知识。它具有诸多优点,比如可以通过连接外部资源增强数据集的知识,方便插入、修改和删除知识项;边所代表的实体间的互连关系可用于数据集的分析阶段。在医疗领域,构建知识图谱有助于提高可发现性、监测最新趋势和发展、管理信息、维护医学事实的参考知识。通过挖掘知识图谱中的相关数据,能够获得COVID - 19临床研究的有价值见解和隐藏的关联数据,优化数据质量,识别医学数据差异,提高研究人员和科学家获取精确信息的效率。此外,知识图谱还可用于分析、分类和寻找新的潜在药物靶点,管理药物开发生命周期中的安全信息,加速药物临床试验进程。在疫情期间,知识图谱能将原始患者数据转化为结构化知识,提高编码工作流程的生产力,节省查找患者数据的时间,消除歧义,增强数据互操作性。由于知识图谱以统一的机器可处理的无模式形式描述数据,用户可以轻松理解内容并提出临时问题,缩短从想法到答案的决策周期。
目前,许多研究人员倾向于使用不同的COVID - 19相关数据集和方法构建知识图谱,市面上也有一些公开可用的COVID - 19知识图
超级会员免费看
订阅专栏 解锁全文

20

被折叠的 条评论
为什么被折叠?



