人类对世界的认知日益广博、精深,如何将浩如烟海的知识有效组织和整理,方便高效存储和查询是一个重要问题。知识图谱(Knowledge Graph)的概念应运而生,简单的说知识图谱就是一个具有有向图结构的知识库,是由实体、关系和属性组成的一种数据结构。正因为具备这种特性,知识图谱数据的存储一般采用图数据库(Graph Database)。
CirroData-Graph是东方国信基于开源项目Apache HugeGraph开发的一套分布式图数据库,可以帮助企业快速的构建图模型数据,在知识图谱这种典型的应用场景中也起到了重要的支撑作用。本文将通过介绍CirroData-Graph在东方国信自主研发的知识图谱产品 ——“先知”平台中的应用,帮助大家更好的理解图数据库的功能与特性。
一、关于知识图谱
将《哈利.波特》中的人物关系用知识图谱表示
知识图谱(Knowledge Graph)本质上是一种基于图模型的关联网络知识表达。知识图谱将实体抽象为顶点,将实体之间的关系抽象为边,通过结构化的形式对知识进行建模和描述,并将知识可视化。
知识图谱一般可以分为两类:
**通用知识图谱:**侧重构建行业常识性的知识,并用于搜索引擎和推荐系统。
**行业知识图谱:**主要面向企业,通过构建不同行业、企业的知识图谱,对企业内部提供知识化服务。
知识图谱的构建方式通常为“自上而下”和“自下而上”两种:
**自上而下:**需要先定义好本体(schema),再基于输入数据完成信息抽取到图谱构建的过程。适用于专业知识方面图谱的构建,比如企业知识图谱、面向领域专业用户使用。
**自下而上:**从开放的关联数据中抽取置信度高的知识,或从非结构化文本中抽取知识