15、遗传分析中的方法比较与SNP基因分型多重方案研究

遗传分析与SNP分型方法研究

遗传分析中的方法比较与SNP基因分型多重方案研究

1. 常用归一化配子不平衡度量D’置信区间估计方法比较

在遗传研究中,常用归一化配子不平衡度量D’来描述基因座之间的连锁不平衡程度。为了估计D’的置信区间(CI),有三种方法可供比较,分别是自举法(bootstrap)、Zapata法和最大似然估计法(MLE)。

1.1 三种方法的性能表现

在所有模拟条件下,当基因型样本大小为250(包含500个单倍型)时,MLE的覆盖率和标准误差分别为0.940和0.0016,Zapata法和自举法的平均覆盖率分别为0.864和0.912。整体性能趋势上,三种方法相近,但在某些方面存在差异。
| 方法 | 覆盖率 | 标准误差 |
| ---- | ---- | ---- |
| MLE | 0.940 | 0.0016 |
| Zapata法 | 0.864 | - |
| 自举法 | 0.912 | - |

从单倍型数据和基因型数据的结果来看,自举法和Zapata法在使用基因型数据时,平均覆盖率远低于单倍型数据的结果,而MLE不受影响。并且,三种方法的标准误差和CI长度在使用基因型数据时都更大。

1.2 不同条件下方法的选择

MLE方法在覆盖率和CI长度的变化方面表现出令人满意的结果,与其他两种方法相比,其覆盖率最接近95%,标准误差最小。然而,在小样本量、极端等位基因频率以及 -0.3 < D’ < 0 的条件下,自举法表现最佳。这是因为在这些条件下,D’的变异性较高,样本量小,导致Zapata法和MLE方法性能不佳。考虑到自举法更耗时,在大规模研究中建议使用M

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值