数据质量测量与频繁模式挖掘中的不确定性处理
在当今的数据处理领域,不确定性是一个不可忽视的问题。无论是数据质量测量,还是频繁模式挖掘,都可能面临数据不精确、信息不足等导致的不确定性。下面我们将深入探讨这两个方面的相关内容。
数据质量测量中的可能性处理
在数据质量测量中,当涉及到对谓词进行评估时,常常会遇到不确定性。例如,在某些情况下,谓词可能无法精确表述,像评估数据库中实体间的关系基数时,“一对多”和“多对多”等概念就难以精确量化。这种情况下,可能性理论可以用来建模谓词评估的不确定性。
-
相关属性
- 完全不确定性(属性2) :对于谓词“u是L”,当u为null值时,有$p^-(u) = (1, 1)$且$p^+(u) = (1, 1)$。这表明当没有任何信息时,会出现完全的不确定性。此属性建立了信息与不确定性之间的某种一致性,也使该方法与使用EP和归一化隶属度有所区别。
- 边界值(属性3) :当$\mu_L(u) = 1$时,$p^-(u) = p^+(u) = (1, 0)$;当$\mu_L(u) = 0$时,$p^-(u) = p^+(u) = (0, 1)$。
- 三值性(属性4) :若$supp(\mu_L) = core(\mu_L)$,则$p^-(u) \in {(1, 0), (1, 1), (0, 1)}$且$p^+(u) \in {(1, 0), (1, 1), (0, 1)}$。
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



