一、安装软件并创建环境
conda create -n bioenv bcftools -c bioconda#通过conda安装bcftools并创建bioenv环境。
conda activate bioenv#激活环境
二、压缩VCF文件为GZ结尾文件,方便进行提取变异
bcftools --version
bcftools view BrgChr03A.gatk.indel.filtered.vcf -Oz -o BrgChr03A.gatk.indel.filtered.vcf.gz#压缩为gz文件
bcftools index BrgChr03A.gatk.indel.filtered.vcf.gz#创建索引
bcftools filter BrgChr03A.gatk.indel.filtered.vcf.gz --regions BrgChr03A:300000-3500000 > 0.3-3.5M.vcf#提取BrgChr03A染色体0.3-3.5M区间内的变异位点并输出为0.3-3.5M.vcf文件
三、安装vcftools进行特定位点的提取
conda create -n bioenv vcftools -c bioconda#通过conda安装vcftools并创建bioenv环境。
conda activate bioenv#激活环境
四、压缩VCF文件和索引同上,然后创建一个包含染色体名称和位置的以分隔符隔开的文本文件,进行提取
vcftools --gzvcf BrgChr03A.gatk.indel.filtered.vcf.gz --positions 6.2-7.6M_positions.list.txt --recode --out 6.2-7.6_position.vcf
#提取6.2-7.6M_positions.list.txt 文件中列出的所有变异位点输出为一个新的VCF