基因扰动实验定性推理与双聚类重采样算法研究
1. 基因扰动实验定性推理
在基因扰动实验中,网络的某些信息可能无法根据扰动实验的结果进行推断。例如,在特定的一组实验中,若基因10、12、13、15、16、18和19未被观测到,那么关于它们可能的调控作用就难以获取有效信息。因此,未观测基因的信息是有价值的,可在后续可能的实验中用于选择重点关注的基因。
在相关文献中,稳态扰动实验的自动处理通常采用定量方法。不过,GenePath软件是个例外,它利用IF - THEN规则推理方法来分析同一生物体单突变体和双突变体之间的定性差异。但GenePath旨在处理表型变量的定性变化,而我们的方法则直接分析基因表达数据。
未来的研究方向有两个方面。一方面,我们算法的定性抽象基于一个固定的数值阈值θ,用于选择每个实验的观测效应。未来可以使该阈值适应数据,将其与所有实验中同一基因的表达(基因特异性阈值)或每个实验中的所有基因(实验特异性阈值)相关联。另一方面,可以扩展定性框架,考虑每个扰动观测效应的正负,将其分类为相对于野生型过表达或低表达,并研究这如何影响三种规则推理程序,以及是否能在新框架中定义新的程序。
2. 双聚类问题概述
在大数据集中寻找相似性在许多科学领域都具有重要作用。它允许在没有明确信息的情况下对多种类型的数据进行分类。近年来,双聚类作为一种新的分析工具被提出并应用于许多特定问题。双聚类算法不仅可以根据选定的条件对数据进行分类,还能找到更精确分类数据的条件。
双聚类问题的目标是在基因表达数据中找到在特定条件子集下具有相似性的基因子集。例如,通过DNA微阵列技术提供的数据集,记录了不同条件下基因转录的mRNA表达水平。我们的任
超级会员免费看
订阅专栏 解锁全文
957

被折叠的 条评论
为什么被折叠?



