基因调控结构推断稳定性与乳腺癌转移特征基因网络研究
基因调控网络结构构建与性能评估
基因调控网络(GRN)的构建中,新节点与现有节点的连接并非均匀。具有较多边的节点相比无连接的节点会吸引更多新节点,这一现象导致了幂律分布。新基因优先连接到现有基因 (i) 的概率 (P(i)) 由公式 (P(i) \sim d_{i}^{\gamma} + b) 给出,其中 (d_{i}) 表示非基因 (i) 自身发起的相邻边的数量(近似于基因 (i) 的入度),(\gamma) 表示优先连接的幂次,(b) 表示无相邻边基因的吸引力。不断添加新边,直到达到预设的边数。由于 GRN 具有因果性,在生成网络时会随机翻转边的方向以创建反馈环。
为评估性能,生成了入度最大为 5 个基因的无标度网络拓扑,模拟了由 50、100 和 250 个基因的无标度网络定义的 GRN,并随机初始化参数或累积概率分布(cpd)表 ({\theta_{ijk}}_{i=1,j=1,k=1}^{I,J,K})。假设基因取 ({-1, 0, +1}) 三种状态,分别代表基因的下调、无调控和上调。无父节点的基因设置为上调,相应的 CPD = ({0.1, 0.1, 0.8}),其余基因的状态由父节点集中的主导状态决定。
为研究时间点数对构建网络规模的影响,使用算法 1 从 GRN 中在 (T \in {10, 50, 100, 200, 250}) 个时间点采样基因表达值。具体步骤如下:
1. 随机初始化第一个时间点的基因表达。
2. 使用公式 (13) 从动态贝叶斯网络(DBN)中采样其他时间点的基因表达。
3. 添加方差 (\sigma^{2} = 0.2) 的高斯噪声。
使