自己的学习笔记,欢迎各路大神批评指正
plink文件类型
- Plink常见格式有五种:ped,map,bed,fam,bim
- PLINK接受VCF文件作为输入,但在PLINK中使用的首选格式是带有结尾.ped(和.map)的文件,以及带有结尾.bed(+ .bim + .fam)的文件
( ped 和 map 是一组的,bed fam bim 是一组的。因为Plink指令是一对一对识别,例如.ped文件一定要有配对的名字.map文件,一对起来才能运行,名字要保持一致)
一般我们提出来了SNP的文件为 .vcf文件, 需要先转换为plink认识的文件类型
# 使用vcftools来实现
vcftools --vcf my.vcf --plink --out plink
# 使用plink来实现
plink --vcf file.vcf --recode --out file
.ped文件
ped是pedigree的缩写,差不多是记录家系(pedigree ) 信息的文件

1.第一列: Family ID表示家族,同一个家族用同一个family ID表示
2.第二列: Individual ID用来表示个体ID,第一列和第二列的信息加起来可以确定出唯一个体
3.第三列: Paternal ID表示父本ID(如果缺少该信息则为’0’,如这个样本没有采集父本的表型信息,相当于确实数据)
4.第四列: Maternal ID表示母本ID(如果缺少该信息则为’0’)
5.第五列: 性别代码(‘1’=男性,‘2’=女性,‘0’=未知)
6.第六列: Phenotype(表型),Plink会自己判断表型的类型,如果缺少该表型数据,可以使用-9/0/非数字来表示。

本文详细介绍了Plink软件中常见的文件格式,包括ped、map、bed、fam和bim的用途及内容,解释了如何从.vcf文件转换至Plink可识别的格式,以及这些文件在遗传学研究中的作用。
最低0.47元/天 解锁文章
1112

被折叠的 条评论
为什么被折叠?



