- 博客(15)
- 收藏
- 关注
原创 利用DESeq2包及clusterProfiler包进行差异表达分析及GO分析
DESeq2包进行差异分析a<-read.table(file ="GEO13067.txt", sep="\t", header = T)##读入表达矩阵a<-a[,-1]rownames(a)<-a[,1]a<-as.data.frame(a)a<-t(a)a[1:3,1:3]##整理成数据框,行名为样本名,列名为基因名order(a$TP53)a<-a[order(a$TP53),]hea
2021-08-27 14:01:38
2031
原创 R语言整理gdc-client工具下载的TCGA数据
提取临床信息##提取临床信息rm(list=ls())options(stringsAsFactors = F)#######Load the packages required to read XML files.library("XML")library("methods")getwd()dir='E:/Rsudio_workstation/TCGA/GDC/clinical/' ##设置临床信息所在的路径all_fiels=list.files(path = dir,patter
2021-07-30 22:11:17
3321
原创 CCLE(Cancer Cell Line Encyclopedia)数据库使用
数据库简介CCLE数据库几个知识点CCLE中细胞系表达谱的GEO数据库GSE36133CCLE数据库数据下载链接
2021-07-26 00:03:00
11909
原创 2021-07-21
数据分析的过程数据采集数据存储数据统计数据挖掘数据量要足够大不在精确关注事物的相关关系数据可视化进行决策R用于数据分析的优势支持算法,可以绘图,语言编码,开源软件
2021-07-21 21:52:50
129
原创 学学习笔记:利用TCGA Assembler工具下载及处理数据
下载包的作者提供的下载地址:https://github.com/compgenome365/TCGA-Assembler-2文献引用:TCGA assembler 2: software pipeline for retrieval and progressing of TCGA/CPTAC data参考操作说明:https://cloud.tencent.com/developer/ar...
2020-04-02 09:21:55
2115
原创 GSEA文件准备及表达相关性分析(R语言)
GSEA文件准备setwd("F:\\GEO\\GEO芯片数据/")##下载好的载入load('GSE35896_eSet.Rdata') a=gset[[1]] ##取出第一个元素赋值给一个对象adat=exprs(a) #a现在是一个对象,取a这个对象通过看说明书知道要用exprs这个函数,该函数得到表达矩阵#现在 得到的dat就是一个表达矩阵,只不过基因的ID是探针名di...
2020-04-01 15:07:18
7957
1
原创 R语言学习笔记1:基础变量
声明:一些内容为生信技能树教学视频学习整理。变量类型a=c(1,"a",3)class(a)#charactera=LETTERSa=1:10dim(a)=c(2,5)pheatmap::pheatmap(a)a[1,2]="3"pheatmap::pheatmap(a)#这时改变了变量的类型就会报错is.data.frame(a)as.data.frame(a)b&l...
2020-03-30 10:16:04
449
原创 TCGA数据库下载及全流程分析(更新中)
一、GDCRNATools包下载首先下载R包if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager")BiocManager::install("GDCRNATools")下载好之后在再官网下载gdc-client工具和manifest文件到当前目录下,具体操作可以...
2020-03-20 14:33:48
11930
原创 文献【综述】Hallmarks of Cancer: The Next Generation 肿瘤的新十大特征
持续的增殖信号(激活增殖)1、体细胞突变激活下游通路Raf构象变化导致MAPK激活;PI3K催化亚基突变导致AKT/PKB激活;2、下调增殖的负反馈失灵Ras突变导致GTP活性下降,MAPK激活;PTEN缺失导致PIP3减少,PI3K激活;3、增值信号过强引起衰老RAS、MYC、RAF等蛋白过表达引起细胞增殖抑制,导致细胞衰老;逃避生长抑制(逃避抑制)1、抑癌基因缺失RB通...
2020-03-08 15:28:01
11408
原创 文献【综述】The Hallmarkers of cancer 肿瘤的特征
一、肿瘤的发生:1.突变致癌学说:原癌基因激活:Ras, MYC抑癌基因失活:Rb , p53, PTEN2.肿瘤遵循达尔文进化论: 经历持续的演变过程涉及多个限速步骤多步骤阶段因素肿瘤的进化树肿瘤六大获得性特征1、自给自足的生长信号胞外生长信号的改变跨膜转导受体突变胞内信号通路异常2、逃避细胞凋亡3、持续的血管新生4、潜力无限的复制能力5、组织侵袭转移6、抗生...
2020-03-07 18:34:53
5439
原创 GEO数据挖掘全流程分析
声明:以下学习资料根据“生信技能树”网络系列免费教学材料整理而成,代码来自“生信技能树”校长jimmy的github。GEO数据库挖掘系列知识分享课程,于2016年首发于生信菜鸟团博客。配套教学视频在B站,特此声明。前言:关于GEO数据我们的目标是要从读懂文献到复刻文献实验,再到掌握GEO数据挖掘的能力。首先便是要广泛阅读,在读文献时,提炼脉络,读懂文献使用了哪个或哪些GSE数据集,对数据做了...
2020-02-29 19:45:43
27613
20
原创 GSEA软件基因富集分析
快速目录链接GSEA分析简介分析步骤1、准备数据(1)表达数据文件(2)表型标签文件2、数据导入3、参数设置及运行GSEA分析简介基因集富集分析(GSEA)是一种计算方法,用于确定一组定义好的基因是否在两种生物状态(如表型)之间显示出统计上显著的一致性差异。分析步骤首先在官网下载软件:软件下载1、准备数据使用GSEA时,可以提供四个数据文件:表达数据集文件、表型标签文件、基因集文件和芯...
2020-02-27 11:29:01
5006
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人