15、遗传分析中的方法比较与SNP基因分型多重方案研究

遗传分析与SNP分型方法研究

最新推荐文章于 2025-11-14 14:09:31 发布

flink9streamer

最新推荐文章于 2025-11-14 14:09:31 发布

阅读量12

点赞数

CC 4.0 BY-SA版权

分类专栏：生物计算的演进之路文章标签： D'置信区间 MLE 自举法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/flink9streamer/article/details/154861279

生物计算的演进之路专栏收录该内容

61 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

遗传分析中的方法比较与SNP基因分型多重方案研究

1. 常用归一化配子不平衡度量D’置信区间估计方法比较

在遗传研究中，常用归一化配子不平衡度量D’来描述基因座之间的连锁不平衡程度。为了估计D’的置信区间（CI），有三种方法可供比较，分别是自举法（bootstrap）、Zapata法和最大似然估计法（MLE）。

1.1 三种方法的性能表现

在所有模拟条件下，当基因型样本大小为250（包含500个单倍型）时，MLE的覆盖率和标准误差分别为0.940和0.0016，Zapata法和自举法的平均覆盖率分别为0.864和0.912。整体性能趋势上，三种方法相近，但在某些方面存在差异。
| 方法 | 覆盖率 | 标准误差 |
| ---- | ---- | ---- |
| MLE | 0.940 | 0.0016 |
| Zapata法 | 0.864 | - |
| 自举法 | 0.912 | - |

从单倍型数据和基因型数据的结果来看，自举法和Zapata法在使用基因型数据时，平均覆盖率远低于单倍型数据的结果，而MLE不受影响。并且，三种方法的标准误差和CI长度在使用基因型数据时都更大。

1.2 不同条件下方法的选择

MLE方法在覆盖率和CI长度的变化方面表现出令人满意的结果，与其他两种方法相比，其覆盖率最接近95%，标准误差最小。然而，在小样本量、极端等位基因频率以及 -0.3 < D’ < 0 的条件下，自举法表现最佳。这是因为在这些条件下，D’的变异性较高，样本量小，导致Zapata法和MLE方法性能不佳。考虑到自举法更耗时，在大规模研究中建议使用M

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。