一、GDCRNATools包下载
首先下载R包
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("GDCRNATools")
下载好之后在再官网下载gdc-client工具和manifest文件到当前目录下,具体操作可以看我再丁香园中的帖子
运行,以COAD数据为例,下载:
library("GDCRNATools")
gdcRNADownload(manifest = 'gdc_manifest_20200320_030436.txt',
directory = 'TCGA-COAD/RNAseq')
但是等了好久发现下载速度实在太慢了,于是就放弃了这种方法,换下一种方法下载。
二、RTCGA包下载
在很久以前下载过这个包,所以直接运行它,安装可以参考这篇文章:安装
library(RTCGA.rnaseq)
dim(READ.mRNA)
library(RTCGA.clinical)
expr <- expressionsTCGA(READ.rnaseq)
然后很快就得到了表达矩阵,但是我们发现列名并不是我们熟悉的gene symbol, 那么就需要转换。
首先把列明提取出来
idlist<-colnames(expr)
idlist<-data.frame(idl

本文详细介绍使用GDCRNATools和RTCGA包下载TCGA数据库中的RNAseq数据和临床信息的过程。从R包安装、数据下载、临床数据获取到表达矩阵的转换,最后整合数据并绘制表达差异图,提供了一套完整的数据处理流程。
最低0.47元/天 解锁文章
1280

被折叠的 条评论
为什么被折叠?



