不同策略计算连锁不平衡度量D’置信区间的比较
在遗传学研究中,连锁不平衡(LD)模式的分析对于识别导致常见人类疾病的遗传变异至关重要。Lewontin’s D’ 是一种常用的 LD 度量,用于研究 LD 模式和单倍型块划分。本文将探讨三种计算 D’ 置信区间(CI)的方法,并对它们进行比较。
1. 研究背景
传统的连锁分析在绘制简单、单基因和高外显率疾病的图谱方面取得了成功,但在绘制人类复杂疾病图谱时存在局限性。近年来,基于 LD 的关联研究成为热点,它具有只需对无关个体进行基因分型以及利用历史重组事件的优势。
Gabriel 等人使用标准化配子不平衡系数 D’ 来识别高 LD 区域,并采用自助法(bootstrap)计算 D’ 的 CI。然而,自助法计算量巨大,尤其是涉及大量单核苷酸多态性(SNP)标记时。Zapata 等人通过大样本理论推导了 D’ 的近似抽样方差,为计算 CI 提供了一种有效方法。本文提出了基于最大似然估计(MLE)和 Fisher 信息理论的第二种方法,同样基于大样本理论的正态近似,可大幅降低计算成本。
2. 方法介绍
2.1 LD 度量 D’
考虑两个双等位基因位点 A 和 B,定义配子不平衡度量 D 和 LD 度量 D’ 如下:
- (D = P_{11} - P_1q_1)
- (D’ = \frac{D}{D_{max}})
其中 (D_{max}) 根据 D 的正负取值不同:
- 当 (D < 0) 时,(D_{max} = min(p_iq_j,(1 - p_i)(1 - q_j)))
- 当 (D > 0) 时,(
超级会员免费看
订阅专栏 解锁全文
5万+

被折叠的 条评论
为什么被折叠?



