SRA ToolKit (sra-tools) 的安装和使用

本文讲述了在Ubuntu系统中,非root用户遇到`pathnotfound`错误后,如何从NCBI下载SRAToolKit,通过wget安装并将其添加到环境变量,以及如何使用工具如`prefetch`和`fastq-dump`的过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言

事情的起因是从NCBI SRA Database下载数据时的一个报错:
  path not found while resolving tree within virtual file system module - 'SRR17******' cannot be found

上次下载数据的时候还是上次,并没有遇到这个问题,所以果断去GitHub搜了搜,提到两个解决方案:

  1. 借助NCBI的 https 或者 ftp 网址,使用wgetcurl等同类工具替代下载
  2. 更新sra-tools

没错,我选择第二种解决方案,记录一下😑
触发关键词:Ubuntu系统、非root用户、安装sra-tools
在这里插入图片描述

从哪里下载 SRA ToolKit

两种选择:

我直接右键Ubuntu那个,然后复制链接 ,https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/3.0.7/sratoolkit.3.0.7-ubuntu64.tar.gz,反手一个wget下载到我想安装的位置

如何安装

下载到我想要位置并解压,操作:

mkdir ~/utils/sra_tools && cd ~/utils/sra_tools
## 下载解压
wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/3.0.7/sratoolkit.3.0.7-ubuntu64.tar.gz
tar -zxvf sratoolkit.3.0.7-ubuntu64.tar.gz
## 我改了个名
mv sratoolkit.3.0.7-ubuntu64 sratoolkit_307 

解压好的目录下有:

到这里就完成 90% 了,最后将这个bin添加到环境中就OK了

# ZSH
echo "export PATH=$HOME/utils/sra_tools/sratoolkit_307/bin:$PATH" >> ~/.zshrc
source ~/.zshrc
# 或者 Bash
echo "export PATH=$HOME/utils/sra_tools/sratoolkit_307/bin:$PATH" >> ~/.bashrc
source ~/.bashrc

至此,SRA ToolKit中的工具就可以用了
在这里插入图片描述

怎么用

以下载双端测序SRR9974623为例:

# 下载 sra 格式文件
prefetch SRR17510933
# 转换为fastq格式
fastq-dump --split-files SRR17510933 
## 或者直接
fastq-dump --split-3 SRR17510933

详细细节,看帮助文档就好了!!!

### SRA Toolkit 使用指南 #### SRA Toolkit 是什么? SRA Toolkit是由NCBI推出的工具集,旨在帮助研究人员更高效地处理下载来自Sequence Read Archive (SRA)的数据。该工具包支持多种操作系统平台,包括Windows、Linux等[^2]。 #### 安装与配置 对于Linux环境下SRA Toolkit安装过程如下: 1. 访问[SRA Tools](https://gitcode.com/gh_mirrors/sr/sra-tools)[^1]页面获取最新版本。 2. 根据目标系统的架构选择合适的预编译二进制文件进行下载。 3. 解压并按照官方提供的README.md中的指示完成设置。 #### 基本命令介绍 - **`prefetch`**: 用于从远程服务器检索指定实验ID对应的元数据以及序列读取档案(SRA files),可以直接通过网络流传输至本地磁盘或者云端存储位置[^3]。 - **`fasterq-dump`**: 将先前由`prefetch`获得的.SRA格式转换成FASTQ格式以便后续分析流程使用;可以通过参数选项如`--split-files`来控制输出形式。 ```bash # 示例:利用更快的方式导出双端测序结果为fastq文件 fasterq-dump --split-files SRR11180057 ``` #### 进阶应用实例 当涉及到具体应用场景时,比如构建基因组索引以备比对之需,则可以参照类似的操作步骤[^4]: ```bash conda activate wes cd ~/wes_cancer/data gunzip Homo_sapiens_assembly38.fasta.gz time bwa index -a bwtsw -p gatk_hg38 ~/wes_cancer/data/Homo_sapiens_assembly38.fasta cd ~/wes_cancer/project ``` 上述代码片段展示了如何激活特定环境(`wes`)后解压缩参考基因组,并创建BWA所需的索引文件供后续变异检测等工作流调用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值