利用并行计算和网格系统进行数量性状基因定位
在生物学研究中,了解动物和植物数量性状背后的遗传因素至关重要。像体重、生长速率、对感染和其他疾病的易感性以及农作物产量等,都是典型的数量性状。而寻找影响这些数量性状的基因组区域,也就是数量性状基因座(QTL)的过程,被称为QTL定位。
1. 数量性状的基因定位
数量性状通常由多个QTL和环境因素共同作用决定。然而,同时搜索多个QTL的模型会使统计分析的计算量大幅增加。寻找影响某个性状的d个QTL的最可能位置,相当于一个d维的全局优化问题。目前,标准的QTL定位软件大多采用穷举网格搜索算法来解决这个全局优化问题。但这种算法虽然稳健,其计算需求会随着d的增加呈指数级增长,这导致通常只能轻松进行单个QTL(d = 1)的定位。
对于多个QTL的模型,一般会使用前向选择技术,即依次进行一系列一维的穷举搜索。在这个过程中,已识别的QTL会在搜索其他QTL时作为已知量逐步加入。不过,这种技术对于一般QTL模型的准确性并不明确。近年来,对同时定位多个QTL的兴趣日益增加,部分原因是对实际数据集的分析发现,某些QTL对之间的相互作用只有通过解决完整的二维优化问题才能被检测到。
2. QTL分析的高效计算方案
计算模型拟合的常用方法是线性回归法,每次目标函数评估都需要解决一个最小二乘问题。为了解决QTL定位中的这些最小二乘问题,有高效的数值算法。由于标准穷举网格搜索的工作量呈指数级增长,用于同时定位多个QTL的全局优化问题的算法受到了特别关注。
以前用于QTL定位问题的优化方法包括:
- 遗传优化算法,在d = 2时使用库例程实现。
- 基于DIRECT方案的算法,在d
超级会员免费看
订阅专栏 解锁全文
23万+

被折叠的 条评论
为什么被折叠?



