本方法可实现快速提取VCF文件中全部样本的的双等位基因深度数据,并提取各类型数据至Tab分割的文本文件中。
1. 数据处理逻辑
- indels去除并单独保存至infile.vcf.indel文件中;
- SNP非双等位基因的被去除并单独存储至infile.vcf.polyallele文件中;
- 冗余位点被去除并保存至infile.vcf.posred文件中;
- ./. 被转换为 0,0
2. 运行示例
python parser_vcf.py sample.vcf
*.snp.vcf.ra.tab结果文件:


3. 主脚本程序