知识图谱构建方式:
自顶向下,自底向上
自顶向下:
先为知识图谱定义好本体与数据模式,再将实体加入到实体库。
注意:此种方式需要利用一些现有的结构化知识库作为基础知识库。
自底向上:
从一些开放链接数据中提取出实体,选择其中置信度较高的加入到知识库,再构建顶层的本体模式。
行业知识库也称为垂直型知识库。
Extract KBs 涉及两个关键技术:
1.实体链接:
指将文档中的实体名字链接到知识库中特定的实体上。
- 实体识别
- 实体消歧
2.关系抽取:
即将文档中的实体关系抽取出来,主要涉及到:
- 词性标注
- 语法分析
- 依存关系树
- 构建分类器
知识图谱搭建步骤:
知识抽取 -> 知识融合 -> 知识推理
知识抽取:
从一些公开的半结构化和非结构化的数据中提取出实体,关系,属性等知识要素。
知识融合:
消除实体,关系,属性等指称项与事实项之间的歧义,形成高质量的知识库。
知识推理:
在已有的知识库基础上进一步挖掘隐含的知识,从而丰富,扩展知识库。
- 基于逻辑的推理
- 基于图的推理