ER通常只是在比较大的基于实体的数据集成(EBDI)流程中的一个中间步骤。EBDI是整合和合理化与等价实体相关的信息集体的过程。每个引用可能只提供关于一个实体的一小部分信息,但是结合其他等价引用中的信息可以合并成一个更加全面的实体数据集。当然,等价引用所提供的一些信息可能是相同的属性,也就是既有正面又有负面影响的情况。当属性值一致时,它往往会增加信心水平认为该值是正确的。但是从另一方面来说,当它们的值有冲突时,它回避了一个问题,即如有的话,哪个值是正确的。解决这些冲突并决定哪些值被保留或删除有时也被称为知识库仲裁knowledgebase arbitration(Doerr, 2003;Liberatore,1995;Revesz, 1993)。冲突属性值的最优选择对IQ也有着一定的影响。如何影响IQ取决于DQ维度的考虑和哪个QoI将被测量的应用程序。例如,如果临界尺寸是精确的,仲裁策略也可能是不同的,即使临界尺寸是可覆盖的并且是及时的。
为了处理客户实体,EBDI被认为是客户数据集成(CDI)的一部分。CDI对于获取所谓的“360度视角”的客户与公司的交互关系所形成的客户关系管理系统(CRM)的基础是至关重要的。在法律实施中,EBDI是构建一个全面的调查文件的重要工具。
实体数据集成(EBDI)是整合多个来源的信息以创建全面实体数据集的过程。本篇讨论了EBDI在客户数据集成(CDI)、法律实施等方面的应用,并介绍了如何处理等价引用中的信息冲突。
2733

被折叠的 条评论
为什么被折叠?



