- 博客(8)
- 收藏
- 关注
原创 7. 生信技能树——TCGA癌症数据2
一. “生存分析前的数据整理”1.读入数据表达矩阵只需要tumor数据,不要normal,将其去掉,新表达矩阵数据命名为exprSet;临床信息需要进一步整理,成为生存分析需要的格式,新临床信息数据命名为meta。由于不同癌症的临床信息表格列名可能不同,这里的代码需要根据实际情况修改。rm(list=ls())proj = "TCGA-KIRC"load(paste0(proj,".Rdata"))library(stringr)2.整理表达矩阵不需要正常样本;使用logCPM或log
2022-04-16 11:19:57
5112
2
原创 生信技能树——GEO芯片数据的合并
GSE83521和GSE89143数据合并1.下载数据rm(list = ls())library(GEOquery)library(stringr)gse = "GSE83521"eSet1 <- getGEO("GSE83521", destdir = '.', getGPL = F)eSet2 <- getGEO("GSE89143", destdir = '.',
2022-04-13 20:48:18
12711
10
原创 6. 生信技能树——TCGA癌症数据1
因为是癌症方面,自己不研究这一方面,所以不常用,但是GEO的转录组数据,是根据这个文件改写的0.安装包options("repos" = c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/"))if(!require("BiocManager")) install.packages("BiocManager",update = F,ask = F)options(BioC_mirror="http://mirrors.tuna.tsinghua.edu
2022-04-13 16:30:06
3176
原创 5. 生信技能树——GEO转录组RNA_seq_GSE162550
和生信技能树GEO转录组“GSE150392“分析类似,唯一区别就是在数据处理和ID转换这一环节略微有区别1.数据下载最方便的是xena。可以网页下载,也可以用代码下载。proj = "DHA"2.生存信息与临床信息这里仅仅是查看一下,到生存信息部分再整理。library(GEOquery)eSet = getGEO("GSE162550",destdir = ".",getGPL = F)eSet = eSet[[1]]exp = exprs(eSet)pd = pData(eSet
2022-04-13 16:19:22
2941
2
转载 多个基因对应一个探针
library(tidyverse)## ── Attaching packages ───────────────────────────── tidyverse 1.2.1 ──## ✔ ggplot2 3.1.0 ✔ purrr 0.2.5## ✔ tibble 1.4.2 ✔ dplyr 0.7.8## ✔ tidyr 0.8.2 ✔ stringr 1.3.1## ✔ readr 1.3.0 ✔ forcats 0.3.0## ── .
2022-04-04 11:51:30
1537
原创 生信技能树R语言学习
一、数据类型和向量1. 数据类型1.1 判断数据类型class()1.2 按Tab键自动补全1.3 数据类型的判断和转换(1)is 族函数,判断,返回值为TRUE或FALSEis.numeric("123")is.character("a")is.logical(TRUE)(2)as族函数实现数据类型之间转换as.matrix() as.numeric()as.character()as.logical()2. 向量(1)有重复的用rep(),有规律的用seq(),随机数
2022-03-30 20:06:23
1788
原创 GEO分析
title: “R Notebook”output: html_notebook1 下载加载包cran_packages <- c('tidyr', 'tibble', 'dplyr', 'stringr', 'ggplot2', 'ggpubr', 'factoext.
2022-03-28 10:07:43
4969
1
原创 1. R语言中grep函数和gsub()函数的使用
1.grep 函数1)语法结构grep(pattern, x, ignore.case = FALSE, perl = FALSE, value = FALSE, fixed = FALSE, useBytes = FALSE, invert = FALSE)各参数的含义如下:(1)pattern: 字符串类型,正则表达式,指定搜索模式,当将fixed参数设置为TRUE时,也可以是一个待搜索的字符串。(2)x : 字符串向量,用于被搜索的字符串。(3)ignore.case: 是否忽略大小写。为
2022-03-24 11:49:16
9522
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人