系列文章目录
生信分析第一步:R语言基础应用以及数据前处理
文章目录
- R包下载
- 使用GEOquery包下载原始数据
- 芯片数据读取
- GEOquery 下载并读取数据
- 提取GEO表达矩阵
- 提取GEO注释信息
- 提取GEO芯片样本及临床信息
前言
用最精简的代码展示生信分析的全部流程
一、提取GEO表达矩阵
得到eSet
对象里包含着各种各样的信息:表达矩阵、芯片如何设计的、样本如何分组 等等~eSet
是一个大列表,我们需要从中提取出表达矩阵,才能进行后续的操作。
###1.load packages ----
library(GEOquery)
library(readxl)
library(tidyverse)
###2 exprs from GEOquery ----
gse <- getGEO(filename = "geo/GSE5327_series_matrix.txt.gz", destdir = ".", getGPL = F )
expr <- exprs(gse)
head(expr)[, 1:6]
###3 expr from Series matrix file ----
expr1 <- read_tsv(file = "geo/GSE5327_series_matrix.txt.gz", comment = "!") #把前面有感叹号的行给去