知识图谱旨在采用图结构来建模和记录世界万物之间的关联关系和只是,以便有效实现更加精准的对象级搜索。其相关技术可以应用在搜索引擎、语言理解、推荐计算、大数据决策分析等众多领域。如今,知识图谱已经是实现认知层面的人工智能不可或缺的重要技术之一。希望通过本文,能对知识图谱相关技术有初步了解。
什么是知识图谱
知识图谱是一种用图模型来描述只是和建模世间万物之间的关联关系的技术方法。知识图谱由节点和边组成,节点可以是实体,如一个人、一本书,或是抽象的概念,如人工智能、知识图谱等。边可以是实体的属性,如姓名、书名或者实体之间的关系,如朋友、配偶。
知识图谱旨在从数据中识别、发现和推断事物与概念之间的复杂关系,是事物关系的可计算模型。知识图谱的构建设计知识建模、关系抽取、图存储、关系推理、实体融合等多方面的技术。而知识图谱的应用则涉及语义搜索、智能问答、语言理解、决策分析等多个领域。构建并利用号知识图谱需要利用知识表示、图数据库、自然语言处理、机器学习扥多方面的技术。
国内外典型的知识图谱项目
早期的知识图谱项目
-
Cyc是持续时间最久、影响范围较广、争议较多的知识库项目。其最初的目标是简历人类最大的常识知识库。
-
WordNet是注明的词典知识库,由普林斯顿大学从1985年开始开发。主要定义了名词、动词、形容词和副词之间的语义关系。
-
ConceptNet源于MIT媒体实验室的OMCS(Open Mind Common Sense)项目,类似于WordNet,但又比WordNet包含更多的关系类型。
互联网时代的知识图谱
-
Freebase。一个开放共享、协同构建的大规模链接数据库。2010年谷歌受够了Freebase作为其知识图谱数据来源之一,2016年谷歌宣布将其数据和API服务全部迁移至Wikidata,并正式关闭Freebase。
-
DBpedia。数据库版本的Wikipedia,是从Wikipedia中抽取出来的链接数据库。