samtools depth主要用来从bam文件中统计指定区域的深度情况。
首先还是简单介绍一下samtools depth的基本用法,如下图所示
我们可以通过samtools depth option 1.bam 2.bam...的方式来运行该软件,此外,最常用的参数是-r参数,我们可以指定一些区域来生成指定区域的深度情况,也可以通过输入一个-b参数输入一个bed 文件来实现该过程。
而得到的结果一共由3列构成,chrome,postion和深度,如下图所示:
实际工作中遇到的一个问题是使用samtools depth来获取捕获区域的未覆盖区域,思路如下:
- 使用samtools depth -a 参数来获取捕获bed区域的缺失区域
- 使用samtools depth -aa 参数来获取捕获bed区域的覆盖度为0的区域(包括未覆盖和缺失区域)
- 使用覆盖度为0的区域减去缺失区域得到未覆盖区域
另外一个问题是捕获效率值的由来,在测序实验开始的时候,会使用捕获试剂盒来捕获想要的区域的片段,但是这些片段并不是就肯定在想要的区域内的,由于序列的相似性也会被捕获到,最终我们测序得到的reads,将这些reads比对回参考基因组就发现有很多reads是比对不到捕获区域的,而使用比对得到的所有碱基数比上比对到捕获区域的碱基数就是捕获效率值。