Fellegi-Sunter模型是第一个基于记录链接的背景来建立关于实体解析的正式理论知识的尝试, 它同时也提供了关于构建和分析模糊匹配规则的实践指导。而SERF模型则是一个更加通用的ER模型,它并未预定义好关于引用是否等价的一系列方法,相应的,该模型将关注点放在为了确保ER系统的唯一输出原则,链接和整合过程所必须满足的各种条件。 同时, 它还介绍了在实体管理和实体捕获中的主要部分:整合引用这一术语。 R-Swoosh算法描述了ER中基本的整合-清理方法。Algebraic模型则从另一中角度来描述ER过程。它将ER过程描述为一组引用集合内部的等价关系,以及该集合的部分子集与ER的输出结果之间的一对一关系。它同时还介绍了一种简单的,通过计算T-W索引来比较ER输出的办法。
《实体解析与信息质量》 - 3. 1.6总结
实体解析模型概览
最新推荐文章于 2022-05-05 15:52:35 发布
本文介绍了几种关键的实体解析(ER)模型,包括Fellegi-Sunter模型、SERF模型、R-Swoosh算法和Algebraic模型。这些模型不仅为记录链接提供了理论基础,还为模糊匹配规则的构建与分析提供了指导。
2083

被折叠的 条评论
为什么被折叠?



