生物数据探索性分析与青光眼进展建模
在生物数据的分析领域,有两项重要的研究成果值得关注,一项是基于概率密度函数的探索性数据分析方法EDAPFuN,另一项是利用细胞自动机(CA)对青光眼进展进行建模。下面将详细介绍这两项研究。
一、EDAPFuN:探索性数据分析方法
EDAPFuN是一种基于邻居数量概率密度函数的探索性数据分析方法,它能够帮助我们发现高维空间中数据分布的一般模式。
(一)数据集分析
研究人员对来自分子生物学界的两个数据集进行了分析,并将EDAPFuN的分析结果与传统的层次聚类(HC)和自组织映射(SOM)工具进行了对比。
1. 第一个数据集 :该数据集包含了168条通路中715种激酶的存在与否信息。为了了解这715个向量在168维空间中的总体分布,需要构建一个低维表示。研究人员分别使用了HC和SOM进行分析,并将结果展示在图5中。同时,他们还将EDAPFuN应用于该数据集,部分系统输出结果展示在图6中。
- 在SOM和HC分析中,可以明显看到一些向量位于与其他向量非常不同的聚类中(SOM的右上角,激酶MAPK3和AKT1)。而在EDAPFuN分析中,这种特性更加明显,表现为在较大的半径r取值范围内,这些向量拥有少量固定比例邻居的概率保持稳定。只有当半径r足够大时,孤立聚类中的向量才开始拥有更大比例的邻居。
- 通过EDAPFuN,还可以追踪任意数量向量之间的关系。在图6中,四条线标记了四个向量,这些线连接了在半径r下找到具有n个邻居的向量的概率。如果想知道某个相关向量的实际邻居,可以通过κr(v)来显示;如果想知道哪些其他向量与相关向量v具有相同比例n的邻居,可以通过Wr(v
超级会员免费看
订阅专栏 解锁全文
898

被折叠的 条评论
为什么被折叠?



