EBOCA:生物医学概念关联本体的证据解析
1. 引言
近年来,生物医学数据的可用性显著增加。这些数据无论是结构化的(如关系数据库)还是非结构化的(如文本),通常由不同的公司或机构以专有格式分别管理,这种数据的异质性使得知识提取变得困难。例如,在COVID - 19治疗中,寻找与特定药物(如Plaquenil,其活性成分为Hydroxychloroquine)相互作用的药物就颇具挑战性,因为科学文献中通常提及的是药物的活性成分而非商品名。
为解决这一问题,生物信息学家将本体视为管理数据爆炸的有效方法。DISNET平台应运而生,它为研究人员提供了一个创建复杂多层图的平台,整合了来自结构化和非结构化源的大规模生物医学数据。然而,这些资源有时缺乏可追溯性,用户需要知道每条信息的来源和支持证据。
在此背景下,EBOCA本体被提出,旨在建模生物医学概念关联的证据。它由两个模块组成:一是生物医学概念及其关联;二是支持这些关联的证据,包含元数据和来源信息。
2. 相关工作
2.1 生物医学本体相关工作
- Open Biomedical Ontologies (OBO) :作为一个本体信息资源,包含60多个本体,可通过BioPortal访问。其中包括Human Phenotype Ontology (HPO)、Sequence Ontology (SO)和PRotein Ontology (PRO)等。
- National Cancer Institute thesaurus (NCIt) :提供近10,000种癌症及相关疾病、17,0
超级会员免费看
订阅专栏 解锁全文
5万+

被折叠的 条评论
为什么被折叠?



