生信分析常见文件——BAM文件

比对软件将质控后的fq格式文件与参考基因组进行比对后得到SAM文件,首先由于sam文件很大,mapping结果乱序不可直接用,将sam文件转为bam格式,再对bam文件进行排序sorting

一个非常好用的工具包——Samtools。

SAM(The Sequence Alignment / Map format)文件是BWA比对软件输出的纯文本文件,BAM(B取自binary)文件是SAM文件的(压缩为1/6)。BAM文件由两部分组成,头部区(header)和主体区(record),都以tab分列。

一、头部区简要介绍

头部区:以’@'开始,体现了比对的一些总体信息。比如比对的SAM格式版本,比对的参考序列,比对使用的软件等。

@HD VN:1.0 SO:unsorted (排序类型)
头部区第一行:VN是格式版本;SO表示比对排序的类型,有unknown(default),unsorted,queryname和coordinate几种。samtools软件在进行行排序后不能自动更新bam文件的SO值,而picard却可以。
@SQ SN:contig1 LN:9401 (序列ID及长度)
参考序列名,这些参考序列决定了比对结果sort的顺序,SN是参考序列名;LN是参考序列长度;每个参考序列为一行。
例如:@SQ SN:NC_000067.6 LN:195471971
@RG ID(read group):sample01 (样品基本信息)

1个sample的测序结果为1个Read Group;该sample可以有多个lib

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值