基因表达数据共聚类的新框架与方法
在基因表达数据分析中,共聚类是一种重要的技术,它可以同时对基因和样本进行分组,有助于发现基因之间的协同作用以及样本之间的相似性。本文将介绍基因表达数据共聚类的相关内容,包括不同的共聚类模型、通用算法以及实验结果。
1. 共聚类模型的不同表述
在共聚类问题中,存在多种接近度度量可以考虑。以下是三种不同的共聚类模型表述:
- 模型 (P1) :如果 $f(s) = s^2$,则共聚类问题 (CC) 可以写成如下形式:
- 目标函数:$\min \left\lVert A - X \times_1 Y^1 \times_2 Y^2 \times_3 \cdots \times_d Y^d \right\rVert_F$
- 约束条件:$X \in \mathbb{R}^{p_1\times p_2\times \cdots \times p_d}$,$Y^j \in \mathbb{R}^{n_j\times p_j}$ 是分配矩阵,$j = 1, 2, \cdots, d$。
- 模型 (P2) :如果 $f(s) = |s|$,则共聚类问题 (CC) 可以写成:
- 目标函数:$\min \sum_{j_1 = 1}^{n_1} \sum_{j_2 = 1}^{n_2} \cdots \sum_{j_d = 1}^{n_d} \left| A_{j_1,j_2,\cdots,j_d} - (X \times_1 Y^1 \times_2 Y^2 \times_3 \cdots \times_d Y^d) {j_1,j_2,\cdots