1. 什么是知识图谱
知识图谱(Knowledge Graph)是由谷歌公司2012年提出来的新名词,其初衷是优化搜索殷勤返回的结果,增强用户搜索质量及体验。
实际上,知识图谱并不是一个全新的概念,早在 2006 年就有文献提出了语义网(Semantic Network)的概念,呼吁推广、完善使用本体模型来形式化表达数据中的隐含语义,RDF(resource description framework,资源描述框架)模式和 OWL(Web ontology language,万维网本体语言)就是基于上述目的产生的(引自知乎)。
通俗讲:知识图谱也可以叫做多关系图(Multi-relational graph),通常包含多种类型的关系和边。
知识图谱中主要包含了两个部分:实体和关系
- 实体:对应图中的节点,指的是现实世界中的事物。
- 关系:对应图中的边,指的是实体之间的关系
2. 知识图谱的计算
图计算:G=(V, E, D), V=vertex(顶点或者节点),E=edge(边), D=data(权重)
对于一个消费者的原始购买行为,有两类节点,分别是用户和产品,边表示购买行为,权重是边上的一个数据结构,可以是购买次数和最后购买时间。
对于我们面临的物理世界的数据问题,都可以利用图结构来抽象表达:社交网络,网页链接关系,用户传播