知识图谱中基于完整性感知的规则学习与评估
在知识图谱(KG)的研究中,规则学习和评分是至关重要的环节。传统的规则评分方法存在一定的局限性,而基于完整性感知的规则学习方法为解决这些问题提供了新的思路。本文将深入探讨基于完整性感知的规则学习方法,包括规则评分、数值语句获取以及评估等方面。
1. 规则评分基础与现有问题
在关联规则学习中,规则评分和排序是核心步骤。常见的规则排名指标有置信度、确信度和提升度等。然而,现有的基于部分完整性假设(PCA)的置信度存在明显不足:
- 对不完整关系规则评分不准确 :仅将部分对作为反例,可能会给预测非常不完整关系事实的规则赋予过高分数,如洗礼地点这类关系。
- 不适用于非批量添加数据的非功能关系 :对于像奖项这类数据,重要的奖项会立即添加,而其他的可能添加缓慢甚至不添加,PCA置信度并不适用。
2. 完整性元数据的表示
通过固定三元组中的主语、谓语或宾语,可以得到6种不同的基数模板,用于报告理想图$G_i$中相应事实的数量。例如,对于$\langle john \ hasChild \ mary \rangle$,可以统计以下几种情况:
1. 约翰的孩子数量。
2. 从约翰到玛丽的边的数量。
3. 到玛丽的入边数量。
4. 以约翰为主语的事实数量。
5. 关于 hasChild 关系的事实数量。
6. 以玛丽为宾语的事实数量。
实际中,模板(1)和(3)的数值语句可以通过网络提取技术、关系的功能属性或众包获取。我们使用基数
超级会员免费看
订阅专栏 解锁全文
24

被折叠的 条评论
为什么被折叠?



