欢迎关注”生信修炼手册”!
DESeq2 接受raw count的定量表格,然后根据样本分组进行差异分析,具体步骤如下
1. 读取数据
读取基因的表达量表格和样本的分组信息两个文件,其中表达量的文件示例如下
gene_id ctrl-1 ctrl-2 ctrl-3 case-1 case-2 case-3
geneA 14 0 11 4 0 12
geneB 125 401 442 175 59 200
每一行为一个基因,每一列代表一个样本。
分组信息的文件示例如下
sample condition
ctrl-1 control
ctrl-2 control
ctrl-3 control
case-1 case
case-2 case
case-3 case
第一列为样本名,第二列为样本的分组信息。
读取文件的代码如下
# 读取表达量的表格
count <- read.table(
"gene.counts.tsv",
header=T,
sep="\t",
row.names=1,
comment.char="",
check.names=F)
# 预处理,过滤低丰度的数据
countData <- count[apply(count, 1, sum) > 0 , ]
# 读取样本分组信息
colData <- read.table(
"sample.group.