基于不可区分性的聚类方法与偏好挖掘技术
在数据挖掘领域,聚类和偏好挖掘是两个重要的研究方向。本文将介绍一种基于不可区分性的聚类方法以及新颖的偏好挖掘技术,探讨它们在处理数据和发现用户偏好方面的应用。
基于不可区分性的聚类方法
等价关系的迭代细化
在聚类过程中,等价关系的细化起着关键作用。通过对等价关系的迭代细化,可以改变对象的不可区分度,从而得到更稳定的聚类结果。
例如,给定一些等价关系 (R_3)、(R_4) 和 (R_5),经过细化后得到新的等价关系 (R’)。初始时:
(U/R′_3 = {
{x_1, x_2, x_3}, {x_4, x_5}})
(U/R′_4 = {
{x_4}, {x_1, x_2, x_3, x_5}})
(U/R′_5 = {
{x_5}, {x_1, x_2, x_3, x_4}})
最终得到分类结果 (U/R′ = { {x_1, x_2, x_3}, {x_4}, {x_5}})。在这个例子中,(R_3)、(R_4) 和 (R_5) 被修改,将相似对象分别纳入 (x_3)、(x_4) 和 (x_5) 的等价类中,但分类变得比之前更粗糙。
当给定另一个阈值 (Th = 2/5) 时,经过第一次细化得到:
(U/R′_1 = {
{x_1, x_2, x_3}, {x_4, x_5}})
(U/R′_2 = {
{x_1, x_2, x_3, x_4}, {x_5}})
(U/R′_3 = {
{