单核苷酸多态性,英文single nucleotide polymorphism,缩写为SNP,读音为Snip。SNP主要是指在基因组水平上引起的单个碱基的变异,其在群体中的发生频率不小于1%,包括单碱基的转换、颠换以及单碱基的插入和缺失等。
多态性示意图(图片来源:genome news network)
突变(mutation)和多态性(polymorphism)的主要区别在于:
1)突变在群体中的发生频率小于1%,而多态性的发生频率在大于1%;
2)突变通常对生生物体是有害的,而多态性通常都是无害的。
多态性和突变的区别(图片来源:genome news network)
那么基于基因组测序数据,包括全基因组测(WGS)、全外显子测序(WES)或靶向测序(targeted sequencing),鉴定基因组变异的标准流程是什么样的呢?(更多精彩请关注微信公众号:AIPuFuBio)
具体如下图所示:
基因组变异鉴定标准流程(DePristo et al. Nature Genetics, 2011)
所以基于测序数据进行基因组变异检测的第一步就是数据匹配,即把测序数据匹配到参考基因组上。匹配测序数据的软件非常多,下图列举了一些典型的