比对软件|Samtools

Samtools是一组用于操作SAM、BAM和CRAM格式的实用程序,包括文件转换、排序、合并和索引等功能。本文介绍了Samtools的安装、SAM与BAM文件、常用命令,如View、Sort、Merge、Index等,帮助用户更好地理解和使用Samtools进行数据分析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Samtools 是一组实用程序,用于操作 SAM(序列比对/映射)、BAM 和 CRAM 格式的比对。它在格式之间进行转换,进行排序、合并和索引,并且可以快速检索任何区域中的读取。被广泛应用在分析流程中。接下来小编就为大家介绍一下Samtools吧!

安装方法

方法一:
下载安装包一步步安装,链接地址为:https://github.com/samtools/samtools/releases/(在此就不做演示)
方法二:
使用conda(建议使用这种方法,简单方便)

conda install samtools

安装成功后,在终端输入samtools,出现如下界面后,表示安装成功.

SAM文件和BAM文件

1.SAM(Sequence Alignment/Map)格式是一种通用的比对格式,用来存储reads到参考序列的比对信息。SAM是一种序列比对格式标准,由sanger制定,是以TAB为分割符的文本格式。主要应用于测序序列mapping到基因组上的结果表示,当然也可以表示任意的多重比对结果。SAM分为两部分,注释信息(header section)和比对结果部分(alignment section)。
2.BAM是SAM的二进制文件,bam文件优点:bam文件为二进制文件,占用的磁盘空间比sam文本文件小;利用bam二进制文件的运算速度快。
对比如下:

查看bam文件头部:

samtools view -h test.bam | head

HD:VN表示版本,SO表示排序方式。
SQ:SN表示参考序列的名称,LN表示参考序列的长度
PG:比对时使用的工具指令。(这里小编用的是hiast2)

常用命令

1.View
view命令的主要功能是:将sam文件转换成bam文件;然后对bam文件进行各种操作,比如数据的排序(不属于本命令的功能)和提取(这些操作 是对bam文件进行的,因而当输入为sam文件的时候,不能进行该操作);最后将排序或提取得到的数据输出为bam或sam(默认的)格式。view命令中,对sam文件头部的输入(-t或-T)和输出(-h)是单独的一些参数来控制的。将sam文件转为bam文件(没有header的sam文件不能转换成bam文件)
基本使用方法:

samtools view -S test.sam -b > test.bam

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值