从NCBI下载:
sra的数据库格式为
/sra/sra-instant/reads/ByRun/sra/{
SRR|ERR|DRR}/<first 6 characters of accession>/<accession>/<accession>.sra
for i in `cat accession.txt`;do
x=$(echo $i | cut -b 1-6)
y=$(echo $i | cut -b 1-3)
ascp -T -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/$y/$x/$i/$i.sra .
done
从EBI下载:
EBI的数据格式为
era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/<first

这篇博客介绍了如何从NCBI和EBI下载SRA/fastq文件,并根据样本信息使用tsv报告进行批量重命名。以GSE149638为例,通过选择特定列并下载tsv报告,然后利用R语言处理文件名,将其转化为如'HMDM_M0_rep1_SRR11652531_1.fastq.gz'的结构,以便更好地管理和识别样本。
最低0.47元/天 解锁文章
799

被折叠的 条评论
为什么被折叠?



