遗传分析中的方法比较与SNP基因分型多重方案研究
1. 常用归一化配子不平衡度量D’置信区间估计方法比较
在遗传研究中,常用归一化配子不平衡度量D’来描述基因座之间的连锁不平衡程度。为了估计D’的置信区间(CI),有三种方法可供比较,分别是自举法(bootstrap)、Zapata法和最大似然估计法(MLE)。
1.1 三种方法的性能表现
在所有模拟条件下,当基因型样本大小为250(包含500个单倍型)时,MLE的覆盖率和标准误差分别为0.940和0.0016,Zapata法和自举法的平均覆盖率分别为0.864和0.912。整体性能趋势上,三种方法相近,但在某些方面存在差异。
| 方法 | 覆盖率 | 标准误差 |
| ---- | ---- | ---- |
| MLE | 0.940 | 0.0016 |
| Zapata法 | 0.864 | - |
| 自举法 | 0.912 | - |
从单倍型数据和基因型数据的结果来看,自举法和Zapata法在使用基因型数据时,平均覆盖率远低于单倍型数据的结果,而MLE不受影响。并且,三种方法的标准误差和CI长度在使用基因型数据时都更大。
1.2 不同条件下方法的选择
MLE方法在覆盖率和CI长度的变化方面表现出令人满意的结果,与其他两种方法相比,其覆盖率最接近95%,标准误差最小。然而,在小样本量、极端等位基因频率以及 -0.3 < D’ < 0 的条件下,自举法表现最佳。这是因为在这些条件下,D’的变异性较高,样本量小,导致Zapata法和MLE方法性能不佳。考虑到自举法更耗时,在大规模研究中建议使用M
遗传分析与SNP分型方法研究
超级会员免费看
订阅专栏 解锁全文
16

被折叠的 条评论
为什么被折叠?



