bowtie和samtools在tophat中的使用

本文详细介绍了RNA-seq比对工具Bowtie的原理、比对策略及参数设置,包括-n和-v模式,以及在Tophat中的使用。Bowtie通过基因组索引进行短reads比对,适用于多种测序技术。Tophat调用Bowtie时固定了一些参数,如-v和-n,用户无法直接修改。同时,文章还简要提到了Samtools的作用,它是处理BAM格式数据的工具,用于处理Tophat生成的比对结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Bowtie介绍

1 Bowtie和一般的比对工具不一样,他适用于短reads比对到大的基因组上,尽管它也支持小的参考序列像amplicons和长达1024readsBowtie采用基因组索引和reads的数据集作为输入文件并输出比对的列表。Bowtie设计思路是,1)短序列在基因组上至少有一处最适匹配, 2)大部分的短序列的质量是比较高,3)短序列在基因组上最适匹配的位置最好只有一处。这些标准基本上和RNA-seq, ChIP-seq以及其它一些正在兴起的测序技术或者再测序技术的要求一致。

2 Bowtie有两种比对策略:

-n (默认使用-n

该参数要求比对时碱基错配数不超过N,这里N的取值范围是0-3,并且这个错配数是指种子序列上允许的碱基错配数。

在全部错配位置的phred 质量值的和可能会超过参数e。对于没有质量值的fasta文件,质量值默认是40.

-v

比对不允许超过V个错配,V的取值范围是0-3.此时忽略质量值。

Strara

-n比对模式下,stratum是定义种子区域的错配数,结合-l参数使用。在-v比对模式下,stratum定义在所有记录中的错配数,结合-m参数使用。

结果参数 –k –a –m –M –best –strara

3 Bowtie使用方法

3.1 Usage:

  bowtie [options]* <ebwt> {-1 <m1> -2 <m2> | --12 <r> | <s>} [<hit>]

 

  <m1>    Comma-separated list of files containing upstream mates (or the

          sequences themselves, if -c is set) paired with mates in <m2>

  <m2>    Comma-separated list of files containing downstream mates (or the

          sequences themselves if -c is set) paired with mates in <m1>

  <r>     Comma-separated list of files containing Crossbow-style reads.  Can be

          a mixture of paired and unpaired.  Specify "-" for stdin.

  <s>     Comma-separated list of files containing unpaired reads, or the

          sequences themselves, if -c is set.  Specify "-" for stdin.

  <hit>   File to write hits to (default: stdout)

3.2 输入参数:

Input:

  -q                 query input files are FA

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值