基因表达数据双聚类与脑磁共振图像分割技术解析
基因表达数据的双聚类算法
在基因表达数据分析中,双聚类是一种重要的技术。传统聚类与双聚类存在显著差异,目前已有多种双聚类算法,各有优劣。
可能性双聚类算法(PBC)
PBC算法用于发现值相干的重叠δ - 双聚类。通过对酵母基因表达数据集的实验,发现该算法在功能富集方面表现出色。从不同本体论的最佳十个双聚类的功能富集结果来看,PBC算法生成的双聚类能够以较高的可靠性分配到基因本体论(GO)的生物过程(BP)、分子功能(MF)和细胞成分(CC)中,在p值、错误发现率(FDR)和预期假阳性方面表现良好,能准确描述已知分类,有助于提取新的生物学见解。
不同算法性能比较
为了评估PBC算法的性能,将其与CC、FLOC和SEBI算法进行了比较,比较指标包括平均均方残差(Havg)、发现的双聚类的平均维度(Vavg、Iavg和Javg)以及Havg与Vavg的比率。具体数据如下表所示:
| 算法 | Havg | Vavg | Iavg | Javg | Havg/Vavg |
| — | — | — | — | — | — |
| PBC | 183.67 | 2742.18 | 436.02 | 7.42 | 0.067 |
| FLOC | 187.54 | 1825.78 | 195.00 | 12.80 | 0.103 |
| CC | 204.29 | 1576.98 | 166.71 | 12.09 | 0.129 |
| SEBI | 205.18 | 209.92 | 13.61 | 15.25 | 0.977 |