GWAS - 基因型与表型的关联分析流程

本文详述了使用plink软件进行SNP数据与单一表型相关分析的流程,包括准备plink文件、表型文件、协变量,以及如何进行基因型与表型的关联分析,最后介绍了结果可视化的方法,包括制作曼哈顿图和QQ-plot。

这里介绍的SNP数据与单一表型的相关分析流程

一、准备plink文件

ped和map文件转换为bed、fam、bim

plink --file mydata --out mydata --make-bed

mydata为ped和map的文件名,不需要加后缀
make-bed表示生成plink可以处理的二进制文件

二、准备表型文件

表型文件.pheno 前两列是FID and IID,第三列是表型Phenotype。
如果准备了表型文件,那么运行plink的同时会忽略原来 .fam 里的表型。
假如有多种表型,第一列和第二列还是Family ID、Individual ID,第三列及以后的每列都是表型,例如Phenotype A、Phenotype B、Phenotype C …

三、准备协变量

提前将协变量信息写入到.covar文件,前两列是FID and IID,后面的列是协变量,主要有年龄、身高、体重等。

四、plink做基因型与表型的关联分析

基因型可以是SNP数据,也可以是连续性变量
表型可以是连续性变量,也可以是二分类变量。

  • 如果表型是二分类变量(0、1这种类型),用plink - -logistic
  • 如果表型是连续的数量表型,用plink–linear,指的是用的连续型线性回归
plink --bfile mydata --linear --pheno pheno.txt --mpheno 1 --covar covar.txt --covar-number 1,2,3 --out mydata –noweb
  • mydata为准备的基因型plink文件名,不需要后缀
  • pheno.txt 为准备的表型
评论 4
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值