EBOCA:生物医学概念关联本体的证据探索
1. 背景与动机
在当今,生物医学数据的可用性急剧增加,这些数据以结构化(如关系数据库)和非结构化(如文本)的形式存在,且通常分散在不同公司或机构中,格式多样。这种数据的异质性使得知识提取变得困难,例如在寻找与特定药物(如治疗 COVID - 19 时的 Plaquenil)相互作用的药物时,由于文章中常使用药物的活性成分(如 Plaquenil 的活性成分 Hydroxychloroquine)而非商品名,使得搜索变得极具挑战性。因此,大规模语义集成信息、建立标准以及明确数据来源变得越来越重要。
生物信息学家将本体视为管理数据爆炸的有效方式,近年来,本体在生物医学知识建模方面得到了广泛应用。DISNET 平台便是其中的一项努力,它为研究人员提供了一个基于人类疾病网络(HDNs)概念创建复杂多层图的平台,整合了来自结构化和非结构化来源的大规模生物医学数据,旨在更好地理解疾病并生成新的药物再利用假设。然而,这些资源有时缺乏可追溯性,用户需要知道每条信息的来源和支持证据,因此添加元数据可以极大地改善决策过程,这在生物医学领域尤为重要。
2. 相关工作
2.1 生物医学本体相关工作
- Open Biomedical Ontologies (OBO) :是一个本体信息资源,包含 60 多个本体,可通过 BioPortal 访问,如 Human Phenotype Ontology (HPO)、Sequence Ontology (SO)、PRotein Ontology (PRO) 等。
- National