目录
1、读入数据并查看
使用R语言来读取一个名为"College.csv"的文件,并将其存储在一个名为"college"的数据框中。然后将数据框的第一列(学校名称)设置为行名,并使用"fix"函数来编辑数据框的内容。最后将数据框保存在变量"A"中
college = read.csv('./data/College.csv')
rownames(college)=college[,1]
fix(college)
A=college
2、数据预处理
college=college[,-c(1,2)]
fix(college)
3、描述性统计分析summary()
summary(college)
4、散点图
pairs(college[,1:10])
5、延边箱线图
# 使用boxplot函数绘制箱线图
boxplot(Outstate ~ Private, data = A, col = "red", xlab = "Private", ylab = "Outstate")
Elite=rep("No",nrow(A))
Elite[A$Top10perc>50]="Yes"
Elite=as.factor(Elite)
college=data.frame(A,Elite)
summary(A)
boxplot(Outstate ~ Elite, data = A, col = "red", xlab = "Elite", ylab = "Outstate")
6.直方图
hist(A$Outstate, col = 2, breaks = 15)