去Gwas Catalog网站进行数据下载

原创

已于 2025-05-13 03:34:30 修改 · 2.1k 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#r语言

于 2024-11-29 20:19:00 首次发布


#清除脏乱的环境
rm(list=ls())

#gwas catalog：数据下载
#txt文件：没有beta值，se值；
#tsv文件：有beta值，se值；
#tsv.gz文件：压缩格式
## 找到数据后→FTP Download→下载最大的那个文件


##(一)tsv文件

# 载入所有需要的库
library(vroom)
library(tidyr)
library(dplyr)
library(data.table)

#GWAS-Catalog网站
#网址：拿菌群中一个来试试手 https://www.ebi.ac.uk/gwas/studies/GCST90027446

#设置工作环境
setwd("C:/Users/Administrator/Desktop/testplace")

#读取文件
junqun1<-vroom("GCST90027446_buildGRCh37.tsv", col_names = TRUE)


head(junqun1)#查看前几行
colnames(junqun1)#查看列名

#重命名列，并转换数据类型
#  %>% 是一个管道操作符（pipe operator），它来自于 dplyr 包，但现在已经内置在 R 的 magrittr 包中。
#  %>%这个操作符的主要作用是将左侧的表达式的结果传递给右侧的函数作为第一个参数。这样可以使得代码更加简洁和易读，尤其是在进行多个步骤的数据操作时。
junqun1<- junqun1 %>%
rename(
    SNP = variant_id,
    CHR = chromosome,
    BP = base_pair_location,
    effect_allele = effect_allele,
    other_allele =other_allele,
    P = p_value,
    EAF= effect_allele_frequency,
    BETA = beta,
    SE= standard_error)%>%
  select(SNP,CHR,BP,effect_allele,other_allele,P, EAF, BETA, SE)%>