从原始数据推断基因调控网络:分子认识论方法
1. 引言
生物途径在基因功能的理解和解释中起着重要作用。真核生物的基因调控是众多元素复杂相互作用的结果,多个转录因子在顺式调控位点的结合共同决定基因转录水平。揭示这些相互作用的本质以及从实验数据中阐明调控网络架构仍是极具挑战性的问题,开发自动化流程有助于处理人类难以应对的大型复杂网络。
目前,自动生成基因调控网络的算法已应用于多种数据类型。微阵列可测量细胞中基因表达水平,但分析网络中每个相互作用的成本高,数据通常稀疏,网络推断算法常需从有限数据集重建复杂功能网络结构。另一种技术通过PCR测量当一个基因被扰动时,各种靶基因mRNA转录的变化,结合这些相互作用可构建调控网络,但需结合系统的先验知识来推断网络结构,贝叶斯网络已用于此目的。还有一种方法是使用生成算法对数据进行逆向工程,从一组观察结果开始生成近似解决方案的网络,通过修改和优化得到最能解释数据的网络。
2. 基因扰动数据
2.1 数据来源
紫色海胆胚胎发育的基因调控数据可从互联网获取,这些数据来自加州理工学院Davidson实验室的实验,涉及对发育早期(<72小时)胚胎的定量PCR研究。
2.2 基因扰动
对海胆胚胎进行的实验包括基因扰动和测量靶基因表达的变化。若扰动的基因是另一个基因的激活剂,在无其他影响的情况下,会导致第二个基因的表达降低;若扰动的基因是抑制剂,则会使后者的表达水平增加。数据中的数值与PCR实验中的循环数相关,反映mRNA的起始水平,正值表示抑制,负值表示激活。转录调控涉及复杂的基因网络,一个转录因子可调节多个基因,存在相互作用链,因此一个基因的扰动可能直接或间接
超级会员免费看
订阅专栏 解锁全文
77

被折叠的 条评论
为什么被折叠?



