利用Top - K模式映射管理模式匹配中的不确定性
在模式匹配领域,不确定性是一个常见的问题。为了解决这一问题,人们提出了Top - K模式映射的方法。下面将详细介绍相关内容。
1. 贡献与概述
具体贡献如下:
- 形式化了模式匹配框架内Top - K模式映射的概念。
- 根据基数约束对Top - K匹配器进行了分类。
- 证明了Top - K映射中的模式与映射正确性之间存在关联,凸显了Top - K映射分析的必要性。
- 提出了一种利用同时进行的Top - K映射来提高映射精度的启发式方法。
- 通过实验结果证实了Top - K映射在提高精度方面的有用性,并评估了应用基于Top - K映射方法的权衡。
2. 模型
2.1 模式匹配模型
设S1和S2是两个模式,分别使用某种数据模型(如关系型或本体型)定义,分别具有n1和n2个属性。属性可以组合成元素(属性集)。模式匹配过程通常分两步进行:
1. 计算相似度 :自动为所有元素对(每对中各有一个来自每个模式的元素)计算相似度,可使用名称匹配、域匹配和结构匹配(如XML层次表示)等方法。相似度通常定义在[0, 1]的尺度上,0表示无相似度,1表示完全相似。
2. 选择最佳映射 :选择一个映射作为最佳映射,该映射应优化某个目标函数F,并满足匹配约束。例如,许多模式匹配工具旨在最大化所选元素的成对权重之和(或平均值)。
常见的模式匹配工具如COMA、OntoBuilder、Cupid等都采用了这种模型的变体。将匹配问题建模为无向
Top-K模式映射提升模式匹配精度
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



