用重测序数据对芯片测序数据进行基因组填充

最新推荐文章于 2025-03-15 14:43:49 发布

原创

最新推荐文章于 2025-03-15 14:43:49 发布 · 1.4k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#java #服务器

本文介绍了如何利用重测序数据对山羊的芯片测序数据进行基因型填充。通过plink将正常格式转换为二进制格式，再用beagle进行基因型填充。在过程中遇到染色体设置、文件格式转换和软件版本问题，最终成功完成填充，使文件大小和位点数显著增加。

file1是从网上下载的山羊的重测序文件，SBWC_goat 是山羊的芯片测序数据文件（两个都是软链接到别人目录下的）

计划用file1对SBWC_goat*做基因型填充

beagle命令;

data parameters ...
  gt=<输入文件;VCF格式;不需要phase>                        (optional)
  ref=<参考序列;bref3或VCF格式;需要phased;本文的file1>      (optional)
  out=<输出文件名>                                        (required)
  map=<连锁图谱>                                          (optional)

1.输入文件gt处理

1.1plink正常格式转二进制格式

map和bed文件转vcf要先转二进制文件、再转vcf（-_-||）

转二进制文件命令 --make-bed

由于楼主这里染色体数目不是人类的23是羊的故设置--chr-set 30

并且还包括一些个体编号故加上--allow-extra-chr

输入命令

plink --file SBWC_goat --make-bed --chr-set 30 --allow-extra-chr --out bi_SBWC_goat

结果

[2022050439@node119 ~]$ plink --file SBWC_goat --make-bed --chr-set 30 --allow-extra-chr --out bi_SBWC_goat
PLINK v1.90p 64-bit (2 Apr 2022)               www.cog-genomics.org/plink/1.9/
(C) 2005-2022 Shaun Purcell, Christopher Chang   GNU General Public License v3
Logging to bi_SBWC_goat.log.
Options in effect:
  --allow-extra-chr
  --chr-set 30
  --file SBWC_goat
  --make-bed
  --out bi_SBWC_goat

128540 MB RAM detected; reserving 64270 MB for mai

最低0.47元/天解锁文章