【GEO Database - 1】用Bionconductor的affy包处理.cel文件


背景介绍:Affymetrix的探针(probe)一般是长为25碱基的寡聚核苷酸;探针总是以perfect match 和mismatch成对出现,其信号值称为PM和MM,成对的perfect match 和mismatch有一个共同的affyID。

CEL文件:信号值和定位信息。
CDF文件:探针对在芯片上的定位信息

affy包是R语言的bioconductor系列包的一个,就一个功能,读取affymetix的基因表达芯片数据-CEL格式数据,处理成表达矩阵!!!(转)

一、从GEO查询GSE65496,并下载GSE65496_family.soft和原始数据(.cel格式)

我直接进入NCBI官网->GEO Database -> 搜索GSE65496后下拉至页面底部进行下载
但是 不推荐!!!
建议直接安装GEOquery包进行下载

if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")
    BiocManager::install("GEOquery")
library("GEOquery")
getGEOSuppFiles("GSE65496")
##解压
untar("GSE46106_RAW.tar")

二、仔细研读soft格式文件

#是对平台的描述
数据从ID那一行开始
数据
我们要用到标绿的那三列(ID,GeneSymbol,ENTREZ_GENE_ID)

三、用Bionconductor下的affy包下函数处理.cel文件,得到探针表达值

1.用Bioconductor中的相应包对表达谱数据做质量分析

首先,安装affy包,读取.cel文件

if (!requ
评论 16
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值