SNP错误率及不符合遗传规律SNP位点分型深度的计算

SNP错误率: 即不符合遗传规律的分型深度占比。

根据实际测序数据,判断不符合遗传规律的位点,并计算相应的分型深度相关指标,而且在实际情况中,如果大量位点出现不符合遗传规律且分型深度有异常表现等情况,就需要进一步排查是否存在样本污染、测序错误或者一些特殊的遗传变异等因素影响了结果。

1. SNP错误率计算

基本原理

SNP(单核苷酸多态性)错误率通常是指在 SNP 分型过程中,错误分型的 SNP 位点数量占总分型 SNP 位点数量的比例,通过比较已知正确分型结果(如来自金标准方法或已验证参考样本)与实际检测所得分型结果来计算。

设参考样本集有n个样本,每个样本检测了m个 SNP 位点,对于每个样本,记其实际检测的 SNP 分型结果与参考结果不一致的位点数量为k。

SNP 错误率E的计算公式如下:

计算公式

2. 不符合遗传规律的SNP位点分型深度的计算

基本原理:

在遗传学中,孟德尔遗传规律是基础。对于常染色体上的 SNP 位点,在一个家系中(例如父母 - 子女家系样本),子代的基因型应该可以从父母的基因型按照一定的遗传规律推导出来

分型深度是指对某个 SNP 位点进行测序时,所获得的支持该位点基因型的测序读长数量。不符合遗传规律的分型深度计算通常涉及到家系样本中基因型的判断以及与预期深度的比较。

以家系三样本为例:

首先依据孟德尔遗传规律确定每个 SNP 位点在家系中的预期基因型。例如,常染色体 SNP 位点,若父亲是纯合基因型AA,母亲是纯合基因型aa,子代预期基因型应为Aa 。然后在实际测序数据中获取各家庭成员该 SNP 位点的分型深度,设父亲该位点分型深度为Df,母亲为Dm,子代为Dc。

当子代实际基因型不符合预期基因型时,记录该位点为不符合遗传规律的位点,对于这些位点,计算不符合遗传规律位点的平均分型深度,其计算公式为:

计算公式

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

生信与基因组学

每一份鼓励是我坚持下去动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值