使用Bioconductor下载GEO(Gene Expression Omnibus)上的数据

本文展示了如何在R中使用Bioconductor包GEOquery从Gene Expression Omnibus(GEO)下载GSE46106数据集,进行初步的数据处理,包括获取表达矩阵、加载NCBI平台注释,并对数据进行预处理。通过示例代码,解释了如何下载原始CEL文件并使用affy包进行表达值计算。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

library(GEOquery)
gset <- getGEO("GSE46106", GSEMatrix =TRUE)


Found 1 file(s)
GSE46106_series_matrix.txt.gz
trying URL 'ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE46nnn/GSE46106/matrix/GSE46106_series_matrix.txt.gz'
ftp data connection made, file length 4110183 bytes
opened URL
==================================================
downloaded 3.9 Mb
 
File stored at: 
/var/folders/n4/11sc2xz13k56hl85z_h2rgq00000gn/T//RtmpBFQdpL/GPL570.soft


length(gset)


gset <- gset[[1]]


head(pData(gset)[,1:5])


load NCBI platform annotation


gpl <- annotation(gset)


platf <- getGEO(gpl, AnnotGPL=TRUE)


File stored at: 
/var/folders/n4/11sc2xz13k56hl85z_h2rgq00000gn/T//RtmpBFQdpL/GPL570.annot.gz
There were 30 warnings (use warnings() to see them)


ncbifd <- data.frame(attr(dataTable(platf), "table"))
eset <- exprs(gset)
head(es
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值