知识图谱负采样策略与日语填字游戏构建研究
知识图谱负采样策略 MDNCaching
在知识图谱(KG)的链接预测任务中,负采样策略起着至关重要的作用。本次研究提出了一种名为 MDNCaching 的增强型负采样策略,旨在解决虚假负样本问题,通过矩阵分解减少潜在正样本的预测。
1. 相关模型与数据集
- 模型评分函数 :
| 模型类型 | 模型名称 | 评分函数 | 定义 | 参数 |
| — | — | — | — | — |
| 基于平移距离 | TransE | $|h + r - t|_i$ | - | $h, r, t \in R^n$ |
| 基于平移距离 | TransD | $|h + w_rw_h^Th + r - (t + w_rw_t^Tt)|_i$ | - | $h, r, t, w_h, w_t, w_r \in R^n$ |
| 基于语义匹配 | DistMult | $h \cdot diag(r) \cdot t^T$ | - | $h, r, t \in R^n$ |
| 基于语义匹配 | ComplEx | $Re(h \cdot diag(r) \cdot t^T)$ | - | $h, r, t \in C^n$ | - 数据集 :实验选用了两个流行的基准数据集 WN18RR 和 FB15K237。这两个数据集是通过分别从之前的 WN18 和 FB15K 数据集中移除逆重复关系构建而成,比原始数据集更具挑战性和现实性。其统计信息如下:
| 数据集 | 实体数量 |
超级会员免费看
订阅专栏 解锁全文
7万+

被折叠的 条评论
为什么被折叠?



