在构建知识图谱时,可以从第三方知识库产品 或已有结构化数据获取知识输入.例如,关联开放数 据项目(1inked open data)会定期发布其经过积累和 整理的语义知识数据,其中既包括前文介绍过的通 用知识库DBpedia和YAG(),也包括面向特定领域 的知识库产品,如MusicBrainz和DrugBank等. 1)合并外部知识库 将外部知识库融合到本地知识库需要处理2个 层面的问题.①数据层的融合,包括实体的指称、属 性、关系以及所属类别等,主要的问题是如何避免实 例以及关系的冲突问题,造成不必要的冗余;②通过 模式层的融合,将新得到的本体融入已有的本体库 中‘j 2=. 为促进知识库融合的标准化,Mendes等人【5 提出了开放数据集成框架(1inked data 3] integration framework,LDIF),用于对I。()D知识库产品进行融 合.其中包括4个步骤:①获取知识;②概念匹配,由 于不同本体库中的概念表达使用的词汇可能不同, 因此需要对概念表达方式进行统一化处理;③实体 匹配,由于知识库中有些实体含义相同但是具有不 同的标识符,因此需要对这些实体进行合并处理;④ 知识评估,知识融合的最后一步是对新增知识进行 验证和评估,以确保知识图谱的内容一致性和准确 性,通常采用的方法是在评估过程中为新加入的知 识赋予可信度值,据此进行知识的过滤和融合. 2)合并关系数据库 在知识图谱构建过程中,一个重要的高质量知 识来源是企业或者机构自己的关系数据库.为了将 这些结构化的历史数据融人到知识图谱中,可以采 用资源描述框架(RDF)作为数据模型.业界和学术 界将这一数据转换过程形象地称为RDB2RDF,其 实质就是将关系数据库的数据换成RDF的三元组 数据.根据W3C的调查报告显示,当前已经出现了 大量RDB2RDF的开源工具(如Triplify,D2R Server,()penI。ink Virtuoso,SparqlMap等),然而由 于缺少标准规范,使得这些工具的推广应用受到极 大制约[5“.为此,w3C于2012年推出了2种映射 语言标准:Direct relational mapping data to Mapping(A direct mapping RDF)和R2RML(RDB language).其中,Direct to of RDF Mapping采用直 接映射的方式,将关系数据库表结构和数据直接输 出为RDF图,在RDF图中所用到的用于表示类和谓 万方数据 词的术语与关系数据库中的表名和字段名保持一致