模糊逻辑在生物信息学中的应用
模糊聚类与共聚类算法
在生物信息学的聚类分析中,有时会出现“噪声”类元素(如凋亡相关基因)被错误聚类为抗凋亡或促凋亡基因的情况。分析发现,问题可能出在相关性相似度上,而非 NERFCM 算法。在生物信息学里,对象聚类和关系聚类都十分有用,但由于数据、聚类算法和相异性之间的关系复杂,我们不能对聚类输出结果过度解读。
模糊共聚类算法在生物数据分析中也有诸多应用。此前已有不少共聚类技术用于生物数据分析,如 Cheng 和 Church 采用均方残差法对酵母细胞周期微阵列数据集进行聚类;Getz 等人使用交替行列层次聚类算法 CTWC 分析微阵列数据;Lazzeroni 和 Owen 引入了格子模型进行共聚类。
模糊共聚类算法还被应用于文本挖掘中的文档和单词同时聚类。除了归一化和数据维度问题外,聚类文档和单词分别与聚类患者和基因类似。目前,模糊共聚类尚未应用于微阵列数据。下面介绍 Oh 等人提出的模糊共聚类算法 FCCM。
FCCM 算法对患者 $i$ 和基因 $j$ 属于共聚类 $c$ 的隶属度有如下约束:
- $\sum_{c = 1}^{C} u_{ci} = 1, u_{ci} \in [0,1], i = 1, \cdots, M$
- $\sum_{j = 1}^{N} w_{cj} = 1, w_{cj} \in [0,1], c = 1, \cdots, C$
其中,$u_{ci}$ 和 $w_{cj}$ 分别是第 $i$ 个患者和第 $j$ 个基因在第 $c$ 个共聚类中的隶属度。FCCM 的目标函数为:
$\max J = \sum_{c = 1}^{C} \sum_{i =
超级会员免费看
订阅专栏 解锁全文

1199

被折叠的 条评论
为什么被折叠?



