图对象半监督聚类与基于引用先验信息的主题模型研究
1. 图对象半监督聚类
1.1 实验设置与方法组合
在图对象半监督聚类的研究中,我们结合了不同的特征选择机制与聚类方法。采用了无监督聚类方法,如传统的 K - means(记为 KM),并将其与半监督特征选择(ssFS)和无监督特征选择(usFS)分别组合,同时还使用了半监督核 K - means(KKM)。
1.2 聚类性能实验
1.2.1 不同方法在约束数量增加时的性能比较
在第一个实验中,我们对不同方法的聚类性能进行了比较。使用两个蛋白质图数据集(聚类数 k 分别为 3 和 6),设置最小支持度 min_sup = 30%,特征数量 t = 80,冗余阈值 δ = 1.0。随着约束数量的增加,我们观察到归一化互信息(NMI)值总体呈上升趋势。其中,ssFS + KKM 取得了最高的 NMI 值,因为它在特征选择和聚类过程中都利用了监督信息。ssFS + KM 次之,这也显示了在考虑约束进行特征选择时,最优特征集的有效性。而 usFS + KKM 和 usFS + KM 的性能较差,因为特征选择步骤是无监督的。特别地,usFS + KM 的 NMI 值在增加约束数量时保持不变,因为它完全没有利用监督信息。最后,VEL 方法的性能最差,这表明子图特征比简单的标签特征更有效。
| 方法 | 特点 | 性能表现 |
|---|---|---|
| ssFS + KKM | 特征选择和聚类都利用监督信息 |
超级会员免费看
订阅专栏 解锁全文

2417

被折叠的 条评论
为什么被折叠?



