SNP错误率: 即不符合遗传规律的分型深度占比。
根据实际测序数据,判断不符合遗传规律的位点,并计算相应的分型深度相关指标,而且在实际情况中,如果大量位点出现不符合遗传规律且分型深度有异常表现等情况,就需要进一步排查是否存在样本污染、测序错误或者一些特殊的遗传变异等因素影响了结果。
1. SNP错误率计算
基本原理:
SNP(单核苷酸多态性)错误率通常是指在 SNP 分型过程中,错误分型的 SNP 位点数量占总分型 SNP 位点数量的比例,通过比较已知正确分型结果(如来自金标准方法或已验证参考样本)与实际检测所得分型结果来计算。
设参考样本集有n个样本,每个样本检测了m个 SNP 位点,对于每个样本,记其实际检测的 SNP 分型结果与参考结果不一致的位点数量为k。
SNP 错误率E的计算公式如下:
2. 不符合遗传规律的SNP位点分型深度的计算
基本原理:
在遗传学中,孟德尔遗传规律是基础。对于常染色体上的 SNP 位点,在一个家系中(例如父母 - 子女家系样本),子代的基因型应该可以从父母的基因型按照一定的遗传规律推导出来。
分型深度是指对某个 SNP 位点进行测序时,所获得的支持该位点基因型的测序读长数量。不符合遗传规律的分型深度计算通常涉及到家系样本中基因型的判断以及与预期深度的比较。
以家系三样本为例:
首先依据孟德尔遗传规律确定每个 SNP 位点在家系中的预期基因型。例如,常染色体 SNP 位点,若父亲是纯合基因型AA,母亲是纯合基因型aa,子代预期基因型应为Aa 。然后在实际测序数据中获取各家庭成员该 SNP 位点的分型深度,设父亲该位点分型深度为Df,母亲为Dm,子代为Dc。
当子代实际基因型不符合预期基因型时,记录该位点为不符合遗传规律的位点,对于这些位点,计算不符合遗传规律位点的平均分型深度,其计算公式为: