知识交换:现状与开放问题
1. 混合证据与映射生成
在知识图谱映射工具(KGMTs)中,不同方法在处理证据时存在差异。例如,MostoDex在处理知识库(KBs)时,使用一个示例和一组源到目标的对应关系。但它要求提供的单个示例必须完整且正确,这给领域专家带来了很大负担。
相比之下,Kimmig等人针对关系交换提出了一种方法,同时使用数据示例和元数据证据(源到目标的对应关系和源约束)。这里的数据和元数据证据可能是不完整或不正确的,他们提出了集体映射发现(CMD)方法,对这些可能不一致的证据进行推理,以生成最能解释证据的模式映射(一组映射规则)。
对于KGMTs而言,一个重要的研究方向是能够利用不完整或不正确的对应关系和数据示例来生成映射,或许可以借助来自链接开放数据(LOD)云自动生成的示例。
另外,将逻辑推理和统计推理充分结合,集体学习对应关系、示例和映射的KGMT将是一个重要的里程碑。像ILIADS、PARIS和CODI等工作在本体合并方面有一定成果,但无法处理简单公理无法解决的深层结构和语义异质性问题。
2. 映射细化
映射生成的一个主要挑战是解决源和目标之间关系的歧义性。通常提供的证据不足以选择单一明确的语义解释,因此映射生成通常包含一个细化阶段,这往往是一个需要用户参与的过程,以获取更多信息来细化映射。
Kensho是基于示例集成范式的一部分,它迭代地使用领域专家的反馈来细化映射规则。传统的数据交换文献致力于研究向领域专家展示的最佳示例集,以及自动生成这些示例、向专家展示并整合专家反馈的方法。
在理论方面,已经研究了在不同传统设置下,一组有限示例能否唯一识别一组映射规则
超级会员免费看
订阅专栏 解锁全文
1383

被折叠的 条评论
为什么被折叠?



