WES与WGS数据线粒体DNA数据分析及检测工具

1. 线粒体DNA的异质性

传统的全外显子组测序(WES)和全基因组测序(WGS)的二代测序(SGS) 数据分析流程,能够识别多种类型的基因改变。但大多数用于基因变异分析和注释的工具,在输出文件中并未对线粒体 DNA(mtDNA)中的变异进行优化。这是由于 mtDNA 具有一种特殊的特性 —— 异质性,即细胞内存在多种类型的线粒体基因组

实际上,与仅存在两份拷贝的核基因组不同,大多数体细胞中 mtDNA 的拷贝数可达约 1000 到 10000 份

因此,mtDNA 可以处于异质状态,即细胞内不同 mtDNA 分子的序列存在差异;或者处于同质状态,即所有 mtDNA 的序列相同突变型和野生型分子的比例通常被称为异质性百分比或异质性频率

尽管如此,利用专门的生物信息学工具,结合进行 SGS的遗传学实验室现有的标准硬件和专业知识,从 WES 或 WGS 的原始 SGS 测序数据中提取这类信息是可行的。

2. 粒体DNA分析基本流程

从通过 WES 和 WGS 测序的样本的 FASTQ 文件出发,能够对线粒体染色体(chrM)进行变异检测,包括同质和异质变异(即使是低至 2 - 3% 以上的低频率变异)

生成 BAM 文件的比对阶段,与经典的 WES 或 WGS 分析流程相同。唯一的区别在于,需要将 FASTQ 文件中的读数比对到人类线粒体基因组(修订的剑桥参考序列 —rCRS,NCBI NC_012920.1),而非完整的人类基因组。从生成的 BAM 文件中,便可以通过生物信息学工具检测线粒体变异。

3. 识别线粒体DNA变异工具

与核基因组不同,核基因组中的变异通常以预期的变异等位基因频率(VAFs)出现,杂合子约为 50%,纯合子约为 100%,而 mtDNA 的异质性带来了独特的挑战。异质变异可以以任何等位基因比例存在,因为每个细胞包含众多线粒体基因组,它们之间可能存在差异。

标准的生物信息学变异检测工具常常会舍弃低 VAF 的变异,将其视为测序假象。然而,在 mtDNA 分析中,即使是低 VAF 的变异也具有重要意义,必须准确识别。因此,需要专门的工具(通常是从用于体细胞癌症突变检测的工具改编而来)来检测所有 VAF 水平的 mtDNA 变异,以确保全面的变异检测。

直到近年来,才开发出专门用于检测线粒体变异的程序,每个程序都有略微不同的特点,并针对识别线粒体基因组特有的变异类型进行了优化。

![[线粒体DNA分析工具.png]]

  • Mutect2:一种广泛使用的工具,特别适用于检测异质的 SNV 和 InDel 变异,最初是为检测体细胞变异(肿瘤)而设计的
  • Mity:该方法用于检测异质的 SNVs 和 InDels,对 WGS 数据非常敏感,能进行广泛的变异注释,并已在临床研究中得到验证。所需的输入是经过比对的数据文件(BAM),会对同聚物区域(m.302 - 319 和 m.3105 - 3109)进行过滤 。
  • MToolBox:此工具用于检测异质的 SNVs 和 InDels,并进行注释。适用于 WGS 和 WES 数据,包括 WES 的脱靶读数。输入可以是比对后的 BAM 文件,也可以是未比对的 FASTQ 文件 。
  • Mt - DNA server:mitoverse 套件中的一个基于云的应用程序,具有直观的界面,用于检测异质的 SNV 和 InDel。能够识别并标记低复杂度区域和已知的核线粒体 DNA 片段(NUMTs)。接受比对或未比对的 WES、WGS 或仅 mtDNA 数据作为输入 。
  • MitoScape:一种用于从 WGS 数据中检测异质 SNVs 和 InDels 的流程,主要为复杂疾病设计。它采用一种新的机器学习方法,实现极其准确的变异检测和去除所谓的 NUMTs。其性能优于 MToolBox 和 Mt - DNA 服务器,并且可以用于估计 mtDNA 拷贝数
  • MitoHPC:一种用于测量 WGS 数据中 mtDNA 拷贝数(以 mtDNA 覆盖度的比率表示)的流程。它还能检测和注释异质的 SNVs 和 InDels,进行额外的环化比对,并生成个体特异性的 mtDNA “参考” 序列,减少假阳性变异的识别。此外,它会标记同聚物、高变区域和 NUMTs 。
  • eKLIPse:旨在识别多个缺失的多个断点,并生成 Circos 图 。
  • MitoSAlt:该工具基于对有断点序列的分析,对缺失和重复进行量化。它包括第二个比对阶段,以识别映射和未映射数据中的断裂序列。特别适用于 WGS 数据。

利用专门的生物信息学工具,可以从 WES 和 WGS 数据中识别 mtDNA 变异,包括同质和异质变异。尽管传统的测序流程通常不会在输出中包含 mtDNA 变异,但通过将读数比对到线粒体基因组,仍然可以进行变异检测。像 Mutect2、Mity 和 MToolBox 等工具,针对检测 mtDNA 特有的变异(如 SNVs 和 InDels)进行了优化。MitoHPC 和 MitoScape 等先进工具还提供了额外的功能,如 mtDNA 拷贝数估计和去除由 NUMTs 导致的假阳性。这些工具支持在分析与人类疾病相关的线粒体变异时的临床和研究应用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

生信与基因组学

每一份鼓励是我坚持下去动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值