GWAS - plink文件类型

本文详细介绍了Plink软件中常见的文件格式,包括ped、map、bed、fam和bim的用途及内容,解释了如何从.vcf文件转换至Plink可识别的格式,以及这些文件在遗传学研究中的作用。

自己的学习笔记,欢迎各路大神批评指正

plink文件类型

  • Plink常见格式有五种:ped,map,bed,fam,bim
  • PLINK接受VCF文件作为输入,但在PLINK中使用的首选格式是带有结尾.ped(和.map)的文件,以及带有结尾.bed(+ .bim + .fam)的文件
    ( ped 和 map 是一组的,bed fam bim 是一组的。因为Plink指令是一对一对识别,例如.ped文件一定要有配对的名字.map文件,一对起来才能运行,名字要保持一致)
    一般我们提出来了SNP的文件为 .vcf文件, 需要先转换为plink认识的文件类型
# 使用vcftools来实现
vcftools --vcf my.vcf --plink --out plink

# 使用plink来实现 
plink --vcf file.vcf --recode --out file

.ped文件

ped是pedigree的缩写,差不多是记录家系(pedigree ) 信息的文件
ped
1.第一列: Family ID表示家族,同一个家族用同一个family ID表示
2.第二列: Individual ID用来表示个体ID,第一列和第二列的信息加起来可以确定出唯一个体
3.第三列: Paternal ID表示父本ID(如果缺少该信息则为’0’,如这个样本没有采集父本的表型信息,相当于确实数据)
4.第四列: Maternal ID表示母本ID(如果缺少该信息则为’0’)
5.第五列: 性别代码(‘1’=男性,‘2’=女性,‘0’=未知)
6.第六列: Phenotype(表型),Plink会自己判断表型的类型,如果缺少该表型数据,可以使用-9/0/非数字来表示。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值