SRA数据下载以及转换格式

本文详细介绍如何从NCBI下载SRA数据,并使用fasterq-dump和fastq-dump工具将SRA格式转换为FASTQ格式。通过对比测试,fasterq-dump在效率上明显优于fastq-dump。

数据下载

NCBI上下载SRA数据,首先要知道SRA号 ,找到sra编码的submission, 之后就可以直接在NCBI上的sra选项上搜索

pgn

如图,点击Runinfo会得到excel文件,里面有各个sra文件的下载链接,用windows的下载软件或者linux下的wget, axel下载

sra转fastq格式

do 
 /data1/tangx/software/sratoolkit.2.9.2-ubuntu64/bin/fasterq-dump.2.9.2 --split-3 -e 20 -p ${i}
done  #转换为fastq格式

fasterq-dump 与fastq-dump类似, 重点参数是-e|threads, 用于选择使用多少线程进行运行,默认是6个线程。 同时考虑到有些人容易着急,还提供了-p选项用于显示当前进度

用一个9G大小的文件进行测试

time fastq-dump --split-3 -O test SRR5318040.sra
# 558.76s user 41.36s system 101% cpu 9:51.82 total
time fasterq-dump --split-3 SRR5318040.sra -e 20 -o SRR5318040
# 582.70s user 121.06s system 1130% cpu 1:02.25 total

fastq-dump花了快10分钟,而fasterq-dump只需要1分钟,快了9倍多。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值