合作研究请联系QQ 2279055353
GEO(Gene Expression Omnibus
)是NCBI(美国国家生物信息中心)下的基因表达数据库,包括各种各样的基因芯片检测技术得到的试验记录与平台信息。GEO是最具知名度的基因表达数据存储数据库,这些数据包括单通道和双通道的微阵列实验,测量对象包括mRNA
, 基因组cDNA
, 蛋白质冗余物,以及各种非阵列技术,例如,高通量测序技术。现在,我们介绍GEO数据库的检索、下载,以及数据的预处理方法。首先,我们介绍GEO数据集查询R语言包——GEOquery
.
GEOquery包的下载与安装
GEOquery包位于生物信息开源软件库Bioconductor
, 在Bioconductor主页的搜索栏输入GEOquery
回车后,出现了下载项。
按照安装提示在R控制台安装即可。
GEO数据组织结构
GEO上的数据通常有四种组织形式,它们分别是:
- Platforms
- Samples
- Series
- Datasets<