知识图谱概述
什么是知识图谱
知识图谱的意义
- 知识图谱能够从语义层次理解系统知识,并且返回用户需要的信息
- 从人工智能的角度,现在的深度学习模型以数据作为驱动,不具备举一反三的能力,知识图谱是认知智能的途径之一——让系统掌握知识并且能进行推理
(语义网:让计算机识别和理解互联网上的内容,并且对不同来源的知识进行融合,帮助人们更快的获取知识;
语义网实现了知识工程、知识图谱的规范化,神经网络强大的特征分布式表示和语义相似度计算能力提供了知识的规模化)
知识图谱的内涵
是一种通用的语义知识描述框架:知识图谱是以三元组为基础,有向图作为数据结构,从知识本体和知识实例两个层次,对世界万物进行体系化、规范化的描述,并且实现高效的知识推理和语义计算的大规模神经网络。
知识描述框架由本体和知识库组成。
本体(元知识数据)是概念化体系,通过对对象类型、属性以及关系类型等对领域知识进行形式化的表示,是抽象的概念表示,不关注具体的个例信息。
知识库是实例组成数据库。
知识图谱由两者构成,具体的实例数据在源数据(框架、Schema)的指引下组成了知识。
知识图谱的应用
不同任务
搜索、智能问答、推荐系统
不同领域
智能金融、智慧司法、医疗领域、军事领域
知识图谱的构建具体步骤
知识建模(知识体系构建)
本体建模,指采用什么样的方式表达知识,构建什么样的本体对知识进行描述
构建本体一般采用RDF和OWL;
资源描述框架RDF将知识表示为“主语-谓语-宾语”的SPO组
OWL本体语言包含了构建本体的很多原语,方便之后的知识推理
知识获取
专家系统、众包构建、自动获取
从三种类型的数据中获取数据
信息抽取的任务由实体识别、实体消歧、关系抽取和事件抽取任务组成
知识融合
对不同来源、不同语言、不同结构的知识进行融合,从而对知识图谱进行完善和更新,
包括知识框架的融合是实例的融合
知识融合的核心是对不同知识图谱中的边和节点进行语义映射,
由竖直方向的融合和水平方向的融合
知识推理
缺失知识的补足
- 传统逻辑规则方法,自动学习推理规则并解决推理中的知识冲突问题
- 基于表示的推理,语义向量的计算
问答任务
知识管理
表存储和图存储、结构化查询语言
知识应用
问答、决策支持
参考:《知识图谱》赵军