TCGA数据库下载及全流程分析(更新中)

本文详细介绍使用GDCRNATools和RTCGA包下载TCGA数据库中的RNAseq数据和临床信息的过程。从R包安装、数据下载、临床数据获取到表达矩阵的转换,最后整合数据并绘制表达差异图,提供了一套完整的数据处理流程。

一、GDCRNATools包下载

首先下载R包

if (!requireNamespace("BiocManager", quietly = TRUE))
  install.packages("BiocManager")

BiocManager::install("GDCRNATools")

下载好之后在再官网下载gdc-client工具和manifest文件到当前目录下,具体操作可以看我再丁香园中的帖子

运行,以COAD数据为例,下载:

library("GDCRNATools")
gdcRNADownload(manifest  = 'gdc_manifest_20200320_030436.txt',
               directory = 'TCGA-COAD/RNAseq')

但是等了好久发现下载速度实在太慢了,于是就放弃了这种方法,换下一种方法下载。

二、RTCGA包下载

在很久以前下载过这个包,所以直接运行它,安装可以参考这篇文章:安装

library(RTCGA.rnaseq)
dim(READ.mRNA)
library(RTCGA.clinical) 
expr <- expressionsTCGA(READ.rnaseq)

然后很快就得到了表达矩阵,但是我们发现列名并不是我们熟悉的gene symbol, 那么就需要转换。

首先把列明提取出来

idlist<-colnames(expr)
idlist<-data.frame(idl
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值