GEO基因芯片数据处理精华(一):GEOquery包

本文介绍了GEO基因芯片数据处理,重点讲解了如何使用R语言的GEOquery包来访问和下载GEO数据库中的数据。GEO数据包括Platforms、Samples、Series和Datasets四种组织形式。通过GEOquery包,用户可以方便地下载GDS、GPL和GSE等数据,并对数据结构进行了详细阐述。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

合作研究请联系QQ 2279055353

GEO(Gene Expression Omnibus)是NCBI(美国国家生物信息中心)下的基因表达数据库,包括各种各样的基因芯片检测技术得到的试验记录与平台信息。GEO是最具知名度的基因表达数据存储数据库,这些数据包括单通道和双通道的微阵列实验,测量对象包括mRNA, 基因组cDNA, 蛋白质冗余物,以及各种非阵列技术,例如,高通量测序技术。现在,我们介绍GEO数据库的检索、下载,以及数据的预处理方法。首先,我们介绍GEO数据集查询R语言包——GEOquery.

GEOquery包的下载与安装

GEOquery包位于生物信息开源软件库Bioconductor, 在Bioconductor主页的搜索栏输入GEOquery回车后,出现了下载项。
在这里插入图片描述

在这里插入图片描述
按照安装提示在R控制台安装即可。

GEO数据组织结构

GEO上的数据通常有四种组织形式,它们分别是:

  • Platforms
  • Samples
  • Series
  • Datasets<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值