提升无监督基因网络推断的学习框架
1. 引言
网络推断通过链接预测在计算社会科学和生物医学领域是一个重要的研究课题。计算生物学家利用高通量基因组数据开发不同方法来重建基因调控网络(GRNs)。现有的GRN重建算法可分为无监督、有监督和半监督三类。有监督算法在网络推断方法中能达到最高精度,但需要大量正负训练示例,这在许多生物体中难以获取。无监督算法仅基于基因表达谱推断网络,无需训练示例,但精度较低。
这里提出一个学习框架,利用时间序列基因表达数据清理无监督方法推断出的GRNs中的链接。常见的无监督方法包括BANJO、TimeDelay - ARACNE、tlCLR、DFG、BPDS、MIDER、Jump3、ScanBMA和Inferelator等。这些无监督方法的主要缺点是常产生缺失和虚假链接,而提出的学习框架包含几个步骤来清理这些链接。
2. 学习框架
2.1 图稀疏化
输入是一个加权有向图$G = (V, E)$,它代表了Inferelator基于时间序列基因表达数据集构建的基因调控网络(GRN)的拓扑结构。$E$是边或链接的集合,$V$是顶点或节点的集合,每个链接代表一种调控关系,每个节点代表一个基因,每条边$e = (u, v) \in E$都有一个权重$W(e)$,其中$0 < W(e) \leq 1$。
图稀疏化方法GeneProbe以图$G$和两个感兴趣的基因(一个源基因或调控基因,一个目标基因或受调控基因)为输入,创建六组基因并输出一个包含这些基因和相关边的推断子图。具体如下:
- 两组k - 骨干基因 :
- k -
超级会员免费看
订阅专栏 解锁全文
14

被折叠的 条评论
为什么被折叠?



