龙源期刊网
http://www.qikan.com.cn
垂直知识图谱的构建与应用研究
作者:阮彤
王梦婕
王昊奋
胡芳槐
来源:《知识管理论坛》
2016
年第
03
期
摘要:
[
目的
/
意义
]
近年来,知识图谱技术受到学术界和工业界的普遍关注。提出数据驱动
的增量式知识图谱构建方法,为构建垂直知识图谱提供一种新思路。同时,通过
3
个用例研究
提供垂直知识图谱的应用示范。
[
方法
/
过程
]
首先给出知识图谱的形式化定义,然后提出数据驱
动的增量式知识图谱构建方法,重点研究构建垂直知识图谱数据图的细节与难点。基于该方
法,本文构建了中医药知识图谱、海洋知识图谱和企业知识图谱。
[
结果
/
结论
]
以上垂直知识图
谱的构建证实了本方法的可行性,它们各自的垂直应用体现了知识图谱的广泛应用。
关键词:知识获取
知识融合
语义搜索
辅助开方
关系发现
分类号:
TP391
1
引言
自从语义网络的概念提出以来,大量的链接开放数据(
Linked Open Data
,简称
LOD
)和
用户生成内容(
User-generated Content
,简称
UGC
)发布在互联网中,互联网从仅包含网页与
网页之间超链接的文档万维网逐步转变为包含大量描述实体和实体之间丰富关系的数据万维
网。在此背景下,为改善搜索引擎效果,谷歌公司于
2012
年提出
“
知识图谱
”
的概念
[1]
:一种
描述真实世界客观存在的实体、概念及它们之间的关联关系的语义网络。
基于知识图谱的应用领域,本文将知识图谱分为通用知识图谱和垂直知识图谱(或行业知
识图谱)。通用知识图谱不面向特定领域,可将其类比为
“
结构化的百科知识
”
。这类知识图谱
包含了大量常识性知识,强调知识的广度。具有代表性的大规模通用知识图谱有
YAGO[2]
、
DBpedia[3]
、
Freebase[4]
、
NELL[5]
等,中文通用知识图谱有
Zhishi.me[6]
和
SSCO[7]
。垂直知
识图谱则面向特定领域,基于行业数据构建,强调知识的深度。垂直知识图谱可以看作基于语
义技术的行业知识库,其潜在使用者是行业的专业人员。
在通用知识图谱的构建方面,已有相对成熟的技术和知识图谱产品,例如各大搜索引擎公
司发布的谷歌知识图谱、百度
“
知心
”
、搜狗
“
知立方
”
等商用知识图谱。而在垂直知识图谱的构
建方面,现有垂直知识图谱常采用手工构建方式,缺乏一套统一的垂直知识图谱构建方法。基
于此,本文面向垂直知识图谱,首先对其进行形式化定义,然后提出数据驱动的增量式知识图
谱构建方法:从多种类型的数据源出发,研究知识获取、融合过程中的细节与难点。最后,本
文利用所提出的知识图谱构建方法构建了中医药知识图谱、海洋知识图谱和企业知识图谱,并
对各自的垂直应用加以阐述,证实了本文方法的可行性和垂直知识图谱的广泛应用性。
2
知识图谱的形式化定义