多结构恢复与聚类模型评估方法
1. 多结构恢复中的概率双聚类
在多结构恢复(MSR)问题中,双聚类是一种替代聚类的有效方法。双聚类技术能够比传统聚类方法获取更高级、更准确的信息,它可以通过描述每个点簇的特征子集来刻画数据。双聚类应用于 MSR 的目标是在偏好矩阵中隔离出子矩阵,使得子集中的点在某些模型或结构下表现出“一致性”。
1.1 实验结果分析
通过对 Adelaide 基准数据集的测试,比较了几种方法在运动分割和平面分割中的误分类错误(ME %),具体数据如下表所示:
| 类别 | k | %out | T - lnkg | RCMSA | RPA | FABIA |
| — | — | — | — | — | — | — |
| biscuitbookbox | 3 | 37.21 | 3.10 | 16.92 | 3.88 | 3.86 |
| breadcartoychips | 4 | 35.20 | 14.29 | 25.69 | 7.50 | 4.22 |
|… |… |… |… |… |… |… |
| mean | - | - | 9.36 | 12.37 | 5.49 | 4.61 |
| median | - | - | 7.80 | 9.87 | 4.57 | 1.66 |
从表中可以看出,FABIA 方法在大多数情况下表现良好,只有三种情况比聚类方法差。可能的原因是一般双聚类方法在测试场景中的双簇数量比 MSR 中的多(例如基因表达分析中约为 100 个,而本数据集中为 3 - 7 个)。为了克服这一问题,可以增加 FABIA 要检索的双簇数量,并根据列重叠
超级会员免费看
订阅专栏 解锁全文
2945

被折叠的 条评论
为什么被折叠?



