知识图谱上的规则归纳与推理
1. 引言
信息提取技术的进步催生了大量图结构的知识库,即知识图谱(KGs),如NELL、DBpedia、YAGO和Wikidata等。这些知识图谱包含数以百万或十亿计的关系事实,以主谓宾(SPO)三元组的形式呈现,例如 ⟨albert einstein marriedTo mileva maric⟩ 或 ⟨albert einstein type phycisist⟩,可直接用正一元和二元一阶逻辑事实表示。
规则学习是知识图谱的一项重要任务,在知识图谱的管理(补全、错误检测)、数据挖掘和语义文化学等多个领域都有广泛应用。知识图谱上的规则形式为 head ← body,其中 head 是二元原子,body 是(可能取反的)二元和一元原子的合取。
传统上,规则归纳在数据库的关系数据挖掘中被研究,近年来也被应用于知识图谱。这些方法可用于从知识图谱中识别显著模式,如 “已婚人士居住在同一地方”,并将其表示为霍恩规则(即仅含正原子的规则),例如:r1 : livesIn(Y, Z) ← marriedTo(X, Y), livesIn(X, Z)。
对于知识图谱的管理,规则学习有两方面好处:一是在开放世界假设下(即缺失的事实被视为未知而非错误),规则可用于推导额外事实,如缺失的居住地点;二是规则可用于消除知识图谱中的错误事实。
当自动学习规则时,会使用支持度、置信度等统计指标来评估规则质量。然而,这些指标仅在知识图谱相对完整时才有意义。对于从不完整的知识图谱中学习的规则,这些指标可能会产生误导,因为它们无法反映缺失事实的模式,这可能导致从不完整和有偏差的知识图谱中提取错误规则。为解决这一问题,人们提出了一些专门针对不完整
超级会员免费看
订阅专栏 解锁全文
23

被折叠的 条评论
为什么被折叠?



