此教程写给像博主一样的小白,欢迎各路大神批评指正
GWAS
GWAS全称“全基因组关联分析”,使用统计模型找到与性状关联的位点,用于分子标记选择(MAS)或者基因定位。
简单来讲,就是找出基因中哪些序列变异(SNP)与疾病相关。即就是统计一个数,找出与表型最有显著性意义的那些基因(位点)。分析方法有:逻辑回归(表型数据为二元);线性回归(表型数据为连续性变量);表型数据正态分析(如果不是正态分布,需转换处理为正态分布)。
R包、plink和EMMAX都可以做GWAS,但是据说后两者做GWAS更快,更容易写出pipeline。以及实验室师兄师姐均采用plink,因此选择学习这个工具。
#plink介绍
PLINK是一个免费的开源全基因组关联分析工具集,在SNP数据统计,过滤,GWAS分析中都可以用得上,而且计算速度很快。直接去百度上搜索plink就可以很容易就找到plink官网(http://www.cog-genomics.org/plink2)功能大概有以下几种:
- 数据管理: SNP数据格式的转换,合并两个或多个文件,提取SNP子集,以二进制文件格式压缩数据等。
- 质量控制的SNP数据统计: 计算丢失基因型率,等位基因,基因型频率,HWE测试,个体和个体对的近亲繁殖,IBS和IBD统计,LD区域计算等。
- GWAS关联分析
- Meta分析
#plink下载
官网现在更新呦plink1.9与plink2.0版本,可以根据自己需要下载,我选择的是1.9 stable版本。
plik下载方便,只要找到相应的系统的版本就可以进行下载了,下载链接地址为:http://www.cog-genomics.org/plink2/下载完解压即可立即使用。
此时在终端中直接输入plink不可行哦
电脑

本文详细介绍GWAS(全基因组关联分析)的基本概念及应用,重点讲解如何使用plink工具进行GWAS分析,包括数据管理、质量控制、关联分析等关键步骤。
最低0.47元/天 解锁文章
5228





