图机器学习(17)——基于文档语料库构建知识图谱
0. 前言
文本数据的爆炸性增长,直接推动了自然语言处理 (Natural Language Processing, NLP) 领域的快速发展。在本节中,通过从文档语料库中提取的信息,基于文档语料库提取的信息,介绍如何利用这些信息构建知识图谱。
1. 基于文档语料库构建知识图谱
在本节中,我们将使用自然语言处理一节中提取的信息,构建关联不同知识要素的网络图谱。我们将重点探讨两种图结构:
- 知识图谱 (
Knowledge-based graph):通过句子的语义推断实体间关系 - 二分图 (
Bipartite graph):建立文档与文本实体间的连接,后可投影为仅含文档节点或实体节点的同质图
2. 知识图谱
知识图谱的价值在于不仅能关联实体,更能赋予关系方向与语义内涵。例如比较以下两种关系:
I (->) buy
订阅专栏 解锁全文
1446

被折叠的 条评论
为什么被折叠?



