TCGA临床数据整理

TCGA临床数据的整理是一个基本的操作 TCGA的官网

在这里插入图片描述我们选择临床数据在Data category 中选择clinical 最重要的在Data format 中一定要选择XML的]格式在这里插入图片描述
选择自己研究的TCGA肿瘤类型,添加到cart里面下载数据
在这里插入图片描述
点击download 下载 cart的内容 保存你们自己喜欢的位置。下面一步是个小技巧 ,使用Windows 的小伙伴在这里插入图片描述
在右侧工具栏搜索XML格式 会把每个文件夹内的XML文件显示出来,最后复制的一个文件夹内最后整理完之后我们导入到RStudio

library("XML")
library("methods")
setwd("H:/gdc-client_v1.4.0_Windows_x64/1")##设置工作路径
dir="H:/gdc-client_v1.4.0_Windows_x64/1"      
all_fiels=list.files(path = dir ,pattern='*.xml$',recursive=T)##导入文件
cl = lapply(all_fiels, function(x){
             result <- xmlParse(file = file.path(dir,x)) 
              rootnode <- xmlRoot(result)  
              xmldataframe <- xmlToDataFrame( rootnode[2] ) 
              return(t(xmldataframe)) })
clinical <- t(do.call(cbind,cl))
write.table(clinical,file="clinical.txt",sep="\t",quote=F,row.names = F)  
评论 17
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值