14、不同策略计算连锁不平衡度量D‘置信区间的比较

最新推荐文章于 2025-12-10 14:54:36 发布

flink9streamer

最新推荐文章于 2025-12-10 14:54:36 发布

阅读量15

点赞数

CC 4.0 BY-SA版权

分类专栏：生物计算的演进之路文章标签：连锁不平衡 D' 置信区间

本文链接：https://blog.youkuaiyun.com/flink9streamer/article/details/154861273

生物计算的演进之路专栏收录该内容

61 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

不同策略计算连锁不平衡度量D’置信区间的比较

在遗传学研究中，连锁不平衡（LD）模式的分析对于识别导致常见人类疾病的遗传变异至关重要。Lewontin’s D’ 是一种常用的 LD 度量，用于研究 LD 模式和单倍型块划分。本文将探讨三种计算 D’ 置信区间（CI）的方法，并对它们进行比较。

1. 研究背景

传统的连锁分析在绘制简单、单基因和高外显率疾病的图谱方面取得了成功，但在绘制人类复杂疾病图谱时存在局限性。近年来，基于 LD 的关联研究成为热点，它具有只需对无关个体进行基因分型以及利用历史重组事件的优势。

Gabriel 等人使用标准化配子不平衡系数 D’ 来识别高 LD 区域，并采用自助法（bootstrap）计算 D’ 的 CI。然而，自助法计算量巨大，尤其是涉及大量单核苷酸多态性（SNP）标记时。Zapata 等人通过大样本理论推导了 D’ 的近似抽样方差，为计算 CI 提供了一种有效方法。本文提出了基于最大似然估计（MLE）和 Fisher 信息理论的第二种方法，同样基于大样本理论的正态近似，可大幅降低计算成本。

2. 方法介绍

2.1 LD 度量 D’

考虑两个双等位基因位点 A 和 B，定义配子不平衡度量 D 和 LD 度量 D’ 如下：
- (D = P_{11} - P_1q_1)
- (D’ = \frac{D}{D_{max}})
其中 (D_{max}) 根据 D 的正负取值不同：
- 当 (D < 0) 时，(D_{max} = min(p_iq_j,(1 - p_i)(1 - q_j)))
- 当 (D > 0) 时，(