知识图谱三元组分类的优质负采样策略
1. 知识图谱与三元组分类概述
知识图谱(KGs)是广泛用于自然问答、网络搜索和数据分析的大型有用资源。它通过实体和关系构成的三元组(<头实体, 关系, 尾实体>)来描述特定领域的事实。标准的数据模型是资源描述框架(RDF),其模式可定义为本体,展示特定领域的属性及其关系。常见的大型知识图谱有 Freebase、Yago、DBpedia 和 WikiData 等。
然而,知识图谱是在开放世界假设(OWA)下创建的,因此是不完整的。知识图谱补全包含三元组分类任务,即区分正确和错误的三元组。为解决这个问题,提出了知识图谱嵌入模型,但知识图谱仅包含正三元组,仅用正三元组训练模型会导致过拟合,所以需要负样本。
| 知识图谱相关概念 | 说明 |
|---|---|
| 知识图谱 | 用三元组描述特定领域事实的大型资源 |
| 开放世界假设(OWA) | 知识图谱创建的假设,导致其不完整 |
| 知识图谱补全 | 包含三元组分类任务,区分正确和错误三元组 |
| 知识图谱嵌入模型 | 用于知识图谱补全任务,但需要负样本 |
下面是知识图谱相关概念的关系流程图:
超级会员免费看
订阅专栏 解锁全文
2733

被折叠的 条评论
为什么被折叠?



