社交大数据中的知识图谱与语义分析应用
1. 知识图谱概述
知识图谱(KGs)近年来在学术界和工业界都备受关注。它能够消化不同的数据格式,推断丰富的数据实体和概念,从而使商业智能应用、客户服务支持、组织内容搜索等多个领域受益。自2012年起,知识图谱就被用作谷歌搜索引擎的核心知识库,用于增强和整合从广泛资源收集的现实实体的检索结果。
知识图谱可分为领域无关(开放世界)和领域相关两类。领域无关的知识图谱包括Freebase、YAGO、Dublin Core(DC)、Simple Knowledge Organization System(SKOS)、Semantically - Interlinked Online Communities(SIOC)和DBPedia知识库等;领域相关的知识图谱则能解决特定领域的问题,并从领域语料库中获取附加值。
然而,目前对于知识图谱尚未有一个公认的正式定义。例如,Ehrlinger等人将其定义为:“知识图谱获取信息并将其集成到本体中,并应用推理机来推导新知识”;Paulheim则给出了更全面的定义:“知识图谱(i)主要描述现实世界的实体及其相互关系,以图的形式组织;(ii)在模式中定义实体的可能类别和关系;(iii)允许任意实体之间潜在地相互关联;(iv)涵盖各种主题领域”。
知识图谱通常基于领域本体构建,以实体和关系的集合来呈现知识领域,提供统一的标准数据表示,即资源描述框架(RDF)。RDF以三元组(主语、谓语、宾语)的形式表示知识,其中主语表示需要描述的资源,谓语表示主语的属性,宾语表示描述主语的属性值。典型的知识图谱以有向图表示,节点表示类模型的实体(资源),边表示这些实体之间的关系(属性)。
例如,
超级会员免费看
订阅专栏 解锁全文
681

被折叠的 条评论
为什么被折叠?



