简介
kingfisher是一款专门用于高通量测序数据下载的工具。支持从公共数据库(ENA、NCBI、SRA、Amazon AWS 和 Google Cloud)获取序列文件及其元数据注释。其输入可以是一个或多个“Run" accession(例如DRR001970),或一个 BioProject accessions(例如PRJNA621514或SRP260223)。
软件主要两种主要模式:get 模式用于下载序列数据,annotate 模式用于下载元数据。在 get 子命令中,Kingfisher 会从一系列冗余源下载数据,直到其中一个有效数据源。下载的数据根据需要转换为SRA/FASTQ/FASTA/GZIP 文件格式,相比于NCBI的SRA工具包下载速度和提取速度更快
安装
Kingfisher可以通过conda/bioconda以通常的方式安装,例如
conda install -c bioconda kingfisher
kingfisher get -r SRR12118866 -m ena-ftp aws-http prefetch
1. annotate 查询SRR数据
# 简略信息
kingfisher annotate -r SRR11181996 -f tsv -o ./SRR11181996.srr.list
# 全部列信息
kingfisher annotate

Kingfisher是一款用于从ENA、NCBI等公共数据库快速下载和提取序列数据的工具,支持get(下载序列数据)和annotate(下载元数据)模式。它提供多种下载方式,包括通过Aspera、curl、prefetch、aws-http、aws-cp和gcp-cp等,且在转换和提取速度上优于NCBI的SRA工具包。此外,Kingfisher还支持单个或多个SRR样本的下载,以及整个BioProject项目的下载。
最低0.47元/天 解锁文章
4759

被折叠的 条评论
为什么被折叠?



