GWAS数据下载详解(1)

1、常用网址:

MRCIEU GWAS/IEU数据库:(IEU OpenGWAS project结合“TwoSampleMR”包

MiBioGen肠道菌群数据库:(MiBioGen

FinnGen数据库:(Access results | FinnGen

UK biobank(http://www.nealelab.is/uk-biobank)

GWAS Catalog (https://www.ebi.ac.uk/gwas/)

2、具体操作:

IEU数据库

在搜索框内检索疾病-以colon cancer为例

选择需要下载的数据

 打开一个数据集:GWAS ID:ukb-b-20145

 读取下载的文件

#清空
rm(list=ls())
gc()
#设置工作目录
setwd("D:\\GWAS\\IEU数据库")
#读取文件
# install.packages("vcfR")
data <- vcfR::read.vcfR("ukb-b-20145.vcf.gz") #读取VCF文件
gt <- data.frame(data@gt)#ES代表beta值、SE代表se、LP代表-log10(P值)、AF代表eaf、“ID”代表SNP的ID
dat <- as.character(unlist(strsplit(gt$UKB.b.20145, split = ":")))#strsplit切分;unlist解开
fix<-data.frame(data@fix)#为SNP位点的基本信息
#转化为data.frame
matrix<-matrix(data=dat,ncol=5,byrow=T)
frame<-data.frame(matrix) 
colnames(frame)<-c("ES","SE","LP","AF","ID")

MiBioGen肠道菌群数据库:

 P值设定:

作为暴露时P值设定为1e-5(0.00001)或者5e-8(0.00000005)

 ​​​​​​

 

 作为结局时P值设定为5e-5(0.00000005)

3、注意事项:

仔细阅读不同GWAS数据的注释信息

4、R包

#gwasrapidd包使用简介
#参考文献:http://mirrors.pku.edu.cn/CRAN/web/packages/gwasrapidd/index.html
library(gwasrapidd)
my_studies<-get_studies(efo_trait = 'colorectal cancer')#查询colorectal cancer相关研究
my_associations <- get_associations(study_id = my_studies@studies$study_id)#查询colorectal cancer相关SNP
dplyr::filter(my_associations@associations, pvalue < 1e-6) %>% # 依据P值进行筛选
  tidyr::drop_na(pvalue) %>% #drop_na 函数去掉所有含有缺失值的记录
  dplyr::pull(association_id) -> association_ids # 提取关联 ID 列(命名为 association_id),最后将提取出来的关联 IDs 存储在一个名为 association_ids 的变量中。
my_associations2 <- my_associations[association_ids]#提取显著SNP
#ieugwasr包使用简介
#参考文献:https://mrcieu.github.io/ieugwasr/articles/guide.html
library(ieugwasr)
ieuinform<-gwasinfo('ieu-a-2')
#从特定研究中提取特定关联
bian<-associations(variants=c("rs123", "7:105561135"), id=c("ieu-a-2", "ieu-a-7"))
#从特定研究中获取tophits
tophit<-tophits(id="ieu-a-2")
#MendelianRandomization包使用简介
#参考文献:http://127.0.0.1:15009/doc/html/Search?objects=1&port=15009
library(MendelianRandomization)
mr_allmethods(mr_input(bx = ldlc, bxse = ldlcse,
                       by = chdlodds, byse = chdloddsse), 
              method="main", iterations = 100)

Finngen数据库是一个用于基因组学研究的在线工具和资源。以下是使用Finngen数据库的步骤: 1. 访问Finngen数据库网站。在网站主页上,您将找到各种可供选择的功能和工具。 2. 在搜索框中输入感兴趣的基因、疾病或其他相关的词语。Finngen数据库将根据您的搜索词提供相应的结果。 3. 点击搜索结果中的相应项目以获取更详细的信息。这些信息可能包括该基因或疾病的相关文献、基因变异的频率、与特定表型或临床特征的相关性等。 4. 使用Finngen的可视化工具来进一步研究和分析数据。该工具允许您探索不同基因间的关系、基因变异频率的变化趋势、基因变异与疾病相关性的热图等等。 5. 另外,您还可以使用Finngen中心提供的其他工具来进行数据挖掘和分析。这些工具包括基因表达数据的查询工具、定量基因表达和变异的关联分析工具等等。 6. 最后,您可以通过Finngen数据库下载相关数据,以便在自己的研究中使用。您可以选择下载整个数据集或特定的数据子集,以满足您的研究需求。 总结来说,使用Finngen数据库可以通过搜索和探索数据来获取与基因、疾病和表型相关的信息,并使用其提供的工具进行进一步的数据分析和挖掘。这些功能和资源可以帮助研究人员更好地理解基因组学和相关疾病的关联性,并为研究提供有价值的数据
评论 17
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值