利用知识图谱加速COVID-19研究
知识图谱通过节点和边的结构组织信息,便于更高效地探索分析。节点代表实体(如论文、作者),边表示实体间关系。某中心于2020年5月公开了COVID-19知识图谱(CKG),该图谱基于艾伦人工智能研究所牵头构建的COVID-19开放研究数据集(CORD-19)构建,支撑了某中心的文献排序和推荐系统。
图谱结构设计
图谱包含五类节点:
- 论文节点:包含标题、ID等元数据
- 作者节点:记录作者姓名
- 机构节点:包含机构名称和地理位置
- 概念节点:标注论文中出现的医学术语(如布洛芬、心功能障碍)
- 主题节点:表示研究领域(如基因组学、流行病学)
边关系包括:作者关联、机构隶属、概念关联、主题关联和论文引用关系。
图谱构建技术
概念提取
采用某中心的医疗实体识别服务,从文本中提取医学实体并分类。例如从"腹部超声提示急性阑尾炎"中识别"腹部(解剖结构)"“超声(检查程序)”“急性阑尾炎(医疗状况)”。
主题生成
使用Z-LDA主题模型分析论文标题、摘要和正文,基于术语频率筛选出10个核心主题,并由医学专家参与审定。
应用案例
引文排序
利用图谱结构实现定制化引文统计,可针对特定主题或概念筛选高影响力论文。
相似论文推荐引擎
结合两种嵌入技术:
- 语义嵌入:使用SciBert模型生成论文

最低0.47元/天 解锁文章
5203

被折叠的 条评论
为什么被折叠?



