SRA ToolKit (sra-tools) 的安装和使用

原创已于 2024-12-13 17:37:29 修改 · 1w 阅读

26 ·

CC 4.0 BY-SA版权

文章标签：

#数据库

于 2023-10-31 11:00:57 首次发布

生物信息学基础专栏收录该内容

15 篇文章

订阅专栏

本文讲述了在Ubuntu系统中，非root用户遇到`pathnotfound`错误后，如何从NCBI下载SRAToolKit，通过wget安装并将其添加到环境变量，以及如何使用工具如`prefetch`和`fastq-dump`的过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

前言

事情的起因是从NCBI SRA Database下载数据时的一个报错：
path not found while resolving tree within virtual file system module - 'SRR17******' cannot be found

上次下载数据的时候还是上次，并没有遇到这个问题，所以果断去GitHub搜了搜，提到两个解决方案：

借助NCBI的 https 或者 ftp 网址，使用wget、curl等同类工具替代下载
更新sra-tools

没错，我选择第二种解决方案，记录一下😑
触发关键词：Ubuntu系统、非root用户、安装sra-tools
在这里插入图片描述

从哪里下载 SRA ToolKit

两种选择：

从NCBI主页进去下载界面
打开NCBI，点击图示的Download，再点击新页面的 Download Tools，然后就会看见SRA Toolkit的下载，点击进去就会到对应系统的下载界面
直接访问下载界面：https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit

我直接右键Ubuntu那个，然后复制链接 ，https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/3.0.7/sratoolkit.3.0.7-ubuntu64.tar.gz，反手一个wget下载到我想安装的位置

如何安装

下载到我想要位置并解压，操作：

mkdir ~/utils/sra_tools && cd ~/utils/sra_tools
## 下载解压
wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/3.0.7/sratoolkit.3.0.7-ubuntu64.tar.gz
tar -zxvf sratoolkit.3.0.7-ubuntu64.tar.gz
## 我改了个名
mv sratoolkit.3.0.7-ubuntu64 sratoolkit_307

解压好的目录下有：

到这里就完成 90% 了，最后将这个bin添加到环境中就OK了

# ZSH
echo "export PATH=$HOME/utils/sra_tools/sratoolkit_307/bin:$PATH" >> ~/.zshrc
source ~/.zshrc
# 或者 Bash
echo "export PATH=$HOME/utils/sra_tools/sratoolkit_307/bin:$PATH" >> ~/.bashrc
source ~/.bashrc

至此，SRA ToolKit中的工具就可以用了
在这里插入图片描述

怎么用

以下载双端测序SRR9974623为例：

# 下载 sra 格式文件
prefetch SRR17510933
# 转换为fastq格式
fastq-dump --split-files SRR17510933 
## 或者直接
fastq-dump --split-3 SRR17510933

详细细节，看帮助文档就好了！！！