知识图谱加速COVID-19科研信息检索

利用知识图谱加速COVID-19研究

知识图谱通过节点和边的结构组织信息,便于更高效地探索分析。节点代表实体(如论文、作者),边表示实体间关系。某中心于2020年5月公开了COVID-19知识图谱(CKG),该图谱基于艾伦人工智能研究所牵头构建的COVID-19开放研究数据集(CORD-19)构建,支撑了某中心的文献排序和推荐系统。

图谱结构设计

图谱包含五类节点:

  • 论文节点:包含标题、ID等元数据
  • 作者节点:记录作者姓名
  • 机构节点:包含机构名称和地理位置
  • 概念节点:标注论文中出现的医学术语(如布洛芬、心功能障碍)
  • 主题节点:表示研究领域(如基因组学、流行病学)

边关系包括:作者关联、机构隶属、概念关联、主题关联和论文引用关系。

图谱构建技术

概念提取

采用某中心的医疗实体识别服务,从文本中提取医学实体并分类。例如从"腹部超声提示急性阑尾炎"中识别"腹部(解剖结构)"“超声(检查程序)”“急性阑尾炎(医疗状况)”。

主题生成

使用Z-LDA主题模型分析论文标题、摘要和正文,基于术语频率筛选出10个核心主题,并由医学专家参与审定。

应用案例

引文排序

利用图谱结构实现定制化引文统计,可针对特定主题或概念筛选高影响力论文。

相似论文推荐引擎

结合两种嵌入技术:

  1. 语义嵌入:使用SciBert模型生成论文
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值