1.2 连锁不平衡 LD
1.2.1 r 2 r^2 r2, D ′ D' D′
LD,两种测量, r 2 r^2 r2, D ′ D' D′。
r 2 r^2 r2指的是两个SNP之间等位基因相关系数的平方,介于0和1之间,它是对两个标记之间共享信息的统计度量,通常用于确定一个SNP作为另一个SNP代理的效果。
D ′ D' D′,种群遗传指标,在O和1之间,表明SNP之间的重组概率。 D ′ D' D′=0,表明完全的连锁平衡和频繁的重组, D ′ D' D′=1,表明两个变异之间不发生重组,处于完全连锁不平衡状态。
--ld
,plink命令,检查一对变异之间的相关性,每个单倍型的频率(基于MAF),基于单倍型的
r
2
r^2
r2,
D
′
D'
D′。
$ plink --bfile hapmap-ceu --ld rs2883059 rs2777888 --out ld_example
# 产生两个文件,ld_example.log ld_example.hh
--ld rs2883059 rs2777888:
R-sq = 0.715909 D' = 1
Haplotype Frequency Expectation under LE
--------- --------- --------------------
CA -0 0.21
TA 0.45 0.24
CG 0.466667 0.256667
TG 0.083333 0.293333
In phase alleles are CG/TA
1.2.2 r 2 r^2 r2与D’的选择
进行研究时,如果您的研究重点是一个多态给定另一个多态的可预测性,那么 r 2 r^2 r2是首选的度量方法。
D’是用来评估重组模式的度量,因为单倍型块通常被定义为 D ′ D' D′的基础。
LDlink (https://ldlink.nci.nih.gov)
参考:
An Introduction to Statistical Genetic Data Analysis.