1. iGenomes
illumina的iGenomes支持Ensembl, NCBI, GATK和UCSC源的参考基因组和注释文件资源批量下载,以及常用比对软件构建的索引,无需自行构建,下载即可使用,传输速度非常块(约10M/s)。
AWS iGenomes github:https://ewels.github.io/AWS-iGenomes/
AWS iGenomes网页下载(不支持批量下载):https://ewels.github.io/AWS-iGenomes/
2. 下载aws-igenomes脚本
# 下载
curl -fsSL https://ewels.github.io/AWS-iGenomes/aws-igenomes.sh > aws-igenomes.sh
chmod +x ./aws-igenomes.sh
# 帮助
./aws-igenomes.sh -h
# ubuntu安装aws
sudo apt install awscli
# aws s3
**支持转
3. 下载资源查询及下载
以下载人类 GATK hg19参考基因组全部资源为例,大小5.1Gb。
./aws-igenomes.sh -t
# 回车查询支持物种
# 选择人
# Please enter a reference genome:
Homo_sapiens
# Please enter a reference source:
GATK
# 参考基因组版本
# Please enter a reference build:
hg19
reference type选项:
reference build选项:
reference source选项:
Ensembl, NCBI, GATK和UCSC
结果文件夹:
4. 人类
# NCBI GRCh38
aws s3 --no-sign-request --region eu-west-1 sync \
# 下载AWS服务器GRCh38/文件夹下所有数据
s3://ngi-igenomes/igenomes/Homo_sapiens/NCBI/GRCh38/ \
# 存放在本地的路径
./references/Homo_sapiens/NCBI/GRCh38/
# Ensembl GRCh37
aws s3 --no-sign-request --region eu-west-1 sync s3://ngi-igenomes/igenomes/Homo_sapiens/Ensembl/GRCh37/ ./references/Homo_sapiens/Ensembl/GRCh37/
# UCSC hg38
aws s3 --no-sign-request --region eu-west-1 sync s3://ngi-igenomes/igenomes/Homo_sapiens/UCSC/hg38/ ./references/Homo_sapiens/UCSC/hg38/
# GATK来源:GRCh38
# aws s3 --no-sign-request --region eu-west-1 sync s3://ngi-igenomes/igenomes/Homo_sapiens/GATK/GRCh38/ ./references/Homo_sapiens/GATK/GRCh38/
5. 小鼠
# NCBI GRCm38
aws s3 --no-sign-request --region eu-west-1 sync s3://ngi-igenomes/igenomes/Mus_musculus/NCBI/GRCm38/ ./references/Mus_musculus/NCBI/GRCm38/
# Ensembl GRCm38
aws s3 --no-sign-request --region eu-west-1 sync s3://ngi-igenomes/igenomes/Mus_musculus/Ensembl/GRCm38/ ./references/Mus_musculus/Ensembl/GRCm38/
# UCSC mm10
aws s3 --no-sign-request --region eu-west-1 sync s3://ngi-igenomes/igenomes/Mus_musculus/UCSC/mm10/ ./references/Mus_musculus/UCSC/mm10/
生信软件文章推荐
生信软件1 - 测序下机文件比对结果可视化工具 visNano
生信软件3 - mapping比对bam文件质量评估工具 qualimap
生信软件4 - 拷贝数变异CNV分析软件 WisecondorX
生信软件7 - 多线程并行运行Linux效率工具Parallel
生信软件8 - bedtools进行窗口划分、窗口GC含量、窗口测序深度和窗口SNP统计
生信软件9 - 多公共数据库数据下载软件Kingfisher
生信软件10 - DNA/RNA/蛋白多序列比对图R包ggmsa
生信软件11 - 基于ACMG的CNV注释工具ClassifyCNV
生信软件12 - 基于Symbol和ENTREZID查询基因注释的R包(easyConvert )
生信软件13 - 基于sambamba 窗口reads计数和平均覆盖度统计
生信软件14 - bcftools提取和注释VCF文件关键信息
生信软件15 - 生信NGS数据分析强大的工具集ngs-bits
生信软件17 - 基于fasta文件的捕获探针设计工具catch
生信软件18 - 基于docker部署Web版 Visual Studio Code
生信软件20 - seqkit+awk+sed+grep高级用法技巧合辑
生信软件21 - 多线程拆分NCBI-SRA文件工具pfastq-dump
生信软件22 - 测序数据5‘和3‘端reads修剪工具sickle
生信软件23 - Samtools和GATK去除PCR重复方法汇总
生信软件24 - 查询物种分类学信息和下载基因组TaxonKit和ncbi-genome-download
生信软件26 - BWA-MEM比对算法性能更好的bwa-mem2
生信软件27 - 基于python的基因注释数据查询/检索库mygene
生信软件28 - fastq与bam的reads数量计算与双端fastq配对检测工具fastq-pair
生信软件29 - 三代数据高效映射精确的长读段比对工具mapquik
生信软件31 - Bcftools操作VCF/BCF文件高级用法合集
生信软件33 - Wgsim生成双端(PE) fastq模拟数据
生信软件34 - 大幅提升Python程序执行效率的工具Pypy
生信软件36 - SAM/BAM/CRAM文件插入SNV/INDEL/SV工具Bamsurgeon
生信软件37 - 基于测序reads变异进行单倍型分型工具WhatsHap