动植物全基因组重测序(GATK)

该文详细描述了一种生物信息学分析流程,包括使用FastQC进行原始数据质控,利用BWA和SAMtools进行序列比对和排序,通过Picard去除重复读,然后用GATK进行变异检测和GVCf生成,最后合并并转换GVCf文件为VCF格式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

三个部分:①原始数据质控,②比对, ③变异检测。

质控软件(fastqc)

fastqc -t 12 -o out_path sample1_1.fq sample1_2.fq

-o --outdir:输出路径 -t --threads:线程数 

比对软件(bwa+samtools)

建立索引 index

bwa index ref.fa

比对

bwa mem ref.fa sample1_1.fq sample1_2.fq > samples.sam

samtools转换

samtools view  -b samples.sam -o samples.bam

排序

samtools sort samples.bam -o samples.sort.bam

picard 去除重复

picard MarkDuplicates -I samples.sort.bam -O samples.markedDup.bam -M file_markedDup_metrics.txt -REMOVE_DUPLICATES true

samtools index samples.markedDup.bam

变异检测(gatk)

java -jar gatk-package-4.1.9.0-local.jar HaplotypeCaller -R ref.fa -I samples.markedDup.bam -O samples.g.vcf -ERC GVCF

gvcf文件合并

ls *.g.vcf.gz > all_gvcf

gatk CombineGVCFs -R ref.fa -V all_gvcf.list -O merged.g.vcf.gz

gvcf文件转vcf文件

gatk GenotypeGVCFs -R ref.fa -V merged.g.vcf.gz -O genotype.vcf.gz

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值