文章大纲
简介
2012 年,谷 歌 提 出 了 知 识 图 谱 (knowledge Graph)的概念,为世界知识和领 域知识的构建提供了一个可资借鉴的手段。
知识图谱的基本组成是由头实体、尾实体和两者之间的关 系组成的三元组关系。目前,对知识图谱 的研究应用主要 包括通用知识图谱和垂直领域知识图谱。
典型的通用知识图谱有 google knowledgegraph、 DBpedia、CN-DBpedia、XLore等。虽然通用知识图谱收集了大量的领域知识,但是受到概念约束,无法完整描述比较复杂 的领域知识。垂直领域知识图谱在领域知识的描述方面优于通用知识图谱,但常采用手工构建方法,因此其构建成本很高。
在知识图谱概念提出之前,众多研究机构已经利 用知识库的存储方式构建了大量核心医学资源,如世界卫生组织维护的国际疾病分类代码ICD-10、美国 国 立 医 学 图 书 馆 的 一 体 化 医 学 语 言 系 统 UMLS 及其收录的100 多种词表和分类体系、国际医疗术语标准开发组织维护的系统化临床医学术语集SNOMED-CT、Linked OpenData(LOD)收集的 1 000 多种生命科学 知 识 库、BioPortal、 Bio2RDF等。上述医学核心资源对医学领域的相关知识进行了专业的描述,这些资源可服务于医学文献检索或医学术语标准化等医学信息化应用, 但还不能满足现代智慧医疗对医学知识描述的结构 化、精细化和自动化的需求。
知识图谱就是在这样的大数据背景下产生的一种知识表示和管理的方式,强调语义检索能力。