连续型变量的描述性分析、t检验,分类变量的卡方检验;
矩阵、列表的元素调用;矩阵操作。
setwd("D:/temp") #设置工作目录
dat_ana <- read.table(file="D:/temp/colon_ana.txt", header=T )
#read.table()读取数据默认将字符型向量转化为因子(stringsAsFactors=T),但对用数值变量编码的因子需重新设定,可用选项colClasses=.
dat_ana <- subset(dat_ana, size > 0 & size <= 150 )
#修改数据框,连续型变量分组,数值变量转化为因子。
dat_ana <- within(dat_ana, {
grade <- as.factor(grade)
t <- as.factor(t)
sizeg <- NA
sizeg[size < 30] <- "1~"
sizeg[size >= 30 & size < 40] <- "30~"
sizeg[size >= 40 & size < 58] <- "40~"
sizeg[size >= 58] <- "58~150"
ageg <- NA
ageg[age < 59] <- "11~"
ageg[age >= 59 & age < 69] <- "59~"
ageg[age >= 69 &age < 79] <- "69~"
ageg[age >= 79] <- "79~106"
ageg <- as.factor(ageg)
sizeg <- as.factor(sizeg)
n_pos <- NA
n_pos[n_positive == 0] <- "no"
n_pos[n_positive > 0] <- "yes"
n_pos <- as.factor(n_pos)
})
#以下为连续型变量的分析
attach(dat_ana)
t1 <- t.test(age ~ ge12node)
t2 <- t.test(size ~ ge12node)
t3 <- t.test(n_positive ~ ge12node)
detach(dat_ana)
datN <- subset(dat_ana, ge12node=="No")
datY <- subset(dat_ana, ge12node=="Yes")
meansY <- round(sapply(datY[c(3, 6, 12)], mean), 2)
meansN <- round(sapply(datN[c(3, 6, 12)], mean), 2)
sdY <- round(sapply(datY[c(3, 6,