肿瘤聚类与车辆路径问题的优化研究
在生物信息学和物流运输领域,肿瘤聚类和车辆路径规划是两个重要的研究方向。本文将介绍基于独立成分分析(ICA)的基因选择方法在肿瘤聚类中的应用,以及基于动态扫描和蚁群算法的混合智能算法在带时间窗的车辆路径问题(VRPTW)中的应用。
基于ICA的基因选择与肿瘤聚类
独立成分分析(ICA)
ICA是主成分分析(PCA)的有用扩展,最初用于从线性混合中盲分离独立源。与PCA旨在使数据集去相关不同,ICA旨在使变换后的系数相互独立(或尽可能独立)。
考虑一个 $p×n$ 的数据矩阵 $X$,其行 $r_i$($i = 1, …, p$)表示个体(基因表达数据中的基因),列 $c_j$($j = 1, …, n$)表示变量(基因表达数据中的细胞样本),$X$ 的ICA模型可以写成:
$X = SA$
其中 $A$ 是一个 $n×n$ 的混合矩阵,$S$ 的列 $s_k$ 被假设为统计独立,称为 $S$ 的独立成分(ICs)。模型(1)意味着 $X$ 的列是ICs的线性混合。$s_k$ 之间的统计独立性可以通过互信息 $I = \sum H(s_k) - H(S)$ 来衡量,其中 $H(s_k)$ 是变量 $s_k$ 的边际熵,$H(S)$ 是 $S$ 的联合熵。估计ICs可以通过找到观测变量的正确线性组合来实现。我们可以对混合矩阵求逆,使得:
$S = A^{-1}X = WX$
然后使用ICA算法找到一个投影矩阵 $W$,使得 $S$ 的行尽可能统计独立。本文采用FastICA算法对基因表达数据进行建模。
基于ICA的基因选择
基因选择是通过将基因
超级会员免费看
订阅专栏 解锁全文
20

被折叠的 条评论
为什么被折叠?



