1. 线粒体DNA的异质性
传统的全外显子组测序(WES)和全基因组测序(WGS)的二代测序(SGS) 数据分析流程,能够识别多种类型的基因改变。但大多数用于基因变异分析和注释的工具,在输出文件中并未对线粒体 DNA(mtDNA)中的变异进行优化。这是由于 mtDNA 具有一种特殊的特性 —— 异质性,即细胞内存在多种类型的线粒体基因组。
实际上,与仅存在两份拷贝的核基因组不同,大多数体细胞中 mtDNA 的拷贝数可达约 1000 到 10000 份。
因此,mtDNA 可以处于异质状态,即细胞内不同 mtDNA 分子的序列存在差异;或者处于同质状态,即所有 mtDNA 的序列相同。突变型和野生型分子的比例通常被称为异质性百分比或异质性频率。
尽管如此,利用专门的生物信息学工具,结合进行 SGS的遗传学实验室现有的标准硬件和专业知识,从 WES 或 WGS 的原始 SGS 测序数据中提取这类信息是可行的。
2. 粒体DNA分析基本流程
从通过 WES 和 WGS 测序的样本的 FASTQ 文件出发,能够对线粒体染色体(chrM)进行变异检测,包括同质和异质变异(即使是低至 2 - 3% 以上的低频率变异)。
生成 BAM 文件的比对阶段,与经典的 WES 或 WGS 分析流程相同。唯一的区别在于,需要将 FASTQ 文件中的读数比对到人类线粒体基因组(修订的剑桥参考序列 —rCRS,NCBI NC_012920.1),而非完整的人类基因组。从生成的 BAM 文件中,便可以通过生物信息学工具检测线粒体变异。
3. 识别线粒体DNA变异工具
与核基因组不同,核基因组中的变异通常以预期的变异等位基因频率(VAFs)出现,杂合子约为 50%,纯合子约为 100%,而 mtDNA

最低0.47元/天 解锁文章
3140

被折叠的 条评论
为什么被折叠?



