《实体解析与信息质量》 - 3. 1.6总结

本文介绍了几种关键的实体解析(ER)模型,包括Fellegi-Sunter模型、SERF模型、R-Swoosh算法和Algebraic模型。这些模型不仅为记录链接提供了理论基础,还为模糊匹配规则的构建与分析提供了指导。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Fellegi-Sunter模型是第一个基于记录链接的背景来建立关于实体解析的正式理论知识的尝试, 它同时也提供了关于构建和分析模糊匹配规则的实践指导。而SERF模型则是一个更加通用的ER模型,它并未预定义好关于引用是否等价的一系列方法,相应的,该模型将关注点放在为了确保ER系统的唯一输出原则,链接和整合过程所必须满足的各种条件。 同时, 它还介绍了在实体管理和实体捕获中的主要部分:整合引用这一术语。 R-Swoosh算法描述了ER中基本的整合-清理方法。Algebraic模型则从另一中角度来描述ER过程。它将ER过程描述为一组引用集合内部的等价关系,以及该集合的部分子集与ER的输出结果之间的一对一关系。它同时还介绍了一种简单的,通过计算T-W索引来比较ER输出的办法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值