BWA用法笔记

0.BWA简介

bwa(全称Burrows-Wheeler Aligner),项目主页:http://bio-bwa.sourceforge.net/,主要功能是将差异度较小的序列比对到一个较大的参考基因组上。其中提供了三种算法:

算法 应用场景
BWA-backtrack illumina测序结果(reads长度不超过100bp)
BWA-SW 支持序列长度70bp-1Mbp,同时支持剪接性比对(split alignments)
BWA-MEM 最常用,最新,最准确,支持序列长度70bp-1Mbp,表现比BWA-backtrack好

1.构建index

官方文档说明:

bwa index [-p prefix] [-a algoType] <in.db.fasta>

其中需要的数据库序列为fasta格式。

选项介绍:


                
### BWA 路径配置和使用方法 #### BWA 路径配置 BWA 本身不直接依赖于外部配置文件来控制其核心功能。它的行为主要通过命令行参数进行调整[^1]。然而,在某些情况下,用户可能需要通过配置文件来管理 BWA 的路径以及相关的软件依赖路径。例如,可以使用 `config.ini` 文件来存储 BWA 和其他相关工具的路径信息,以便于脚本调用和管理。以下是一个示例配置文件的内容: ```ini [Reference] hg19 = /public/analysis/pipeline/reference/hg19/ucsc.hg19.fa [Bin] chrome_length = /public/analysis/pipeline/input/bin/chr_length [Software] bwa = ~/anaconda3/envs/bin/bwa samtools = ~/anaconda3/envs/bin/samtools ``` 在上述配置文件中,`bwa` 的路径被指定为 `~/anaconda3/envs/bin/bwa`,这意味着 BWA 被安装在 Miniconda 环境中。为了确保 BWA 能够正确运行,用户需要确保该路径存在于系统的 `PATH` 环境变量中,或者在调用 BWA 时显式指定完整路径。 #### BWA 安装与路径设置 在 Linux 系统下,可以通过 Miniconda 来安装 BWA。首先,需要下载并安装 Miniconda: ```bash wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh bash Miniconda3-latest-Linux-x86_64.sh ``` 安装完成后,可以通过创建和激活一个虚拟环境,并在该环境中安装 BWA: ```bash conda create -n bwa_env conda activate bwa_env conda install -c bioconda bwa ``` 安装完成后,BWA 的可执行文件通常会被放置在 `bwa_env` 环境的 `bin` 目录下,例如 `~/miniconda3/envs/bwa_env/bin/bwa`。为了方便使用,可以将这个路径添加到系统的 `PATH` 环境变量中,或者在调用 BWA 时直接使用完整路径。 #### BWA 使用方法 BWA 的主要功能包括构建参考基因组索引、比对测序数据以及处理比对结果。以下是一些常见的 BWA 使用示例: ##### 构建参考基因组索引 在进行比对之前,需要先为参考基因组构建索引: ```bash bwa index reference.fa ``` 这条命令会生成多个索引文件,这些文件将被用于后续的比对过程。 ##### 比对二代测序数据 使用 BWA 对二代测序数据进行比对时,可以使用以下命令: ```bash bwa mem -t 16 reference.fa sr.1.fa sr.2.fa | samtools sort -O BAM -@4 > aligned.bam ``` 在这个命令中,`-t 16` 参数指定了使用的线程数,`reference.fa` 是参考基因组文件,`sr.1.fa` 和 `sr.2.fa` 是双端测序数据。比对结果会被输出为 BAM 格式的文件 `aligned.bam`。 ##### 使用 BWA 进行纠错 BWA 还可以用于对组装结果进行纠错。例如,使用 BWA 对经过初步组装的基因组进行纠错: ```bash bwa index dbg.cns.fa bwa mem -t 16 ../dbg.cns.fa sr.1.fa sr.2.fa | samtools sort -O SAM | wtpoa-cns -t 16 -x sam-sr -d ../dbg.cns.fa -i - -fodbg.srp.fa ``` 在这个过程中,首先需要为初步组装的基因组 `dbg.cns.fa` 构建索引,然后使用 BWA 对二代测序数据进行比对,最后使用 `wtpoa-cns` 工具根据比对结果对基因组进行纠错。 #### 注意事项 - **路径问题**:在使用 BWA 时,必须确保所有涉及的文件路径都是正确的。如果文件不在当前目录,需要提供完整的绝对路径或相对路径。 - **环境变量**:确保 BWA 的安装路径已经被添加到系统的 `PATH` 环境变量中,或者在调用时使用完整路径。 - **线程数**:根据系统的硬件配置,合理设置 `-t` 参数以充分利用多线程处理能力。 通过上述步骤,用户可以有效地配置 BWA 的路径并正确使用其功能。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值