R语言 实例操作

连续型变量的描述性分析、t检验,分类变量的卡方检验;
矩阵、列表的元素调用;矩阵操作。

setwd("D:/temp") #设置工作目录
dat_ana <- read.table(file="D:/temp/colon_ana.txt", header=T )
#read.table()读取数据默认将字符型向量转化为因子(stringsAsFactors=T),但对用数值变量编码的因子需重新设定,可用选项colClasses=.
dat_ana <- subset(dat_ana, size > 0 & size <= 150 )
#修改数据框,连续型变量分组,数值变量转化为因子。
dat_ana <- within(dat_ana, {
  grade <- as.factor(grade)
  t <- as.factor(t)
  sizeg <- NA
  sizeg[size < 30] <- "1~"
  sizeg[size >= 30 & size < 40] <- "30~"
  sizeg[size >= 40 & size < 58] <- "40~"
  sizeg[size >= 58] <- "58~150"
  ageg <- NA
  ageg[age < 59] <- "11~"
  ageg[age >= 59 & age < 69] <- "59~"
  ageg[age >= 69 &age < 79] <- "69~"
  ageg[age >= 79] <- "79~106"
  ageg <- as.factor(ageg)
  sizeg <- as.factor(sizeg)
  n_pos <- NA
  n_pos[n_positive == 0] <- "no"
  n_pos[n_positive > 0] <- "yes"
  n_pos <- as.factor(n_pos)
})
#以下为连续型变量的分析
attach(dat_ana)
t1 <- t.test(age ~ ge12node)
t2 <- t.test(size ~ ge12node)
t3 <- t.test(n_positive ~ ge12node)
detach(dat_ana)
datN <- subset(dat_ana, ge12node=="No")
datY <- subset(dat_ana, ge12node=="Yes")
meansY <- round(sapply(datY[c(3, 6, 12)], mean), 2)  
meansN <- round(sapply(datN[c(3, 6, 12)], mean), 2)
sdY <- round(sapply(datY[c(3, 6, 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值