R的可视化操作(一)
接下来两节我会使用ggplot2 package分享一些常用的可视化操作。这一节主要包括条形图(柱状图)、折线图和散点图
条形图(柱状图)
条形图用来展现离散型单变量的分布特征,柱状图是垂直放置的条形图。至于饼图与玫瑰图,则可以将笛卡尔坐标系转换为极坐标系,由于数据分析中这两种图的使用频率不高,因此我在这里不做进一步分享
Scores <- as.data.frame(c(rep(1, 27), rep(2, 23)))
names(Scores) <- "分科情况"
Scores$分科情况 <- factor(Scores$分科情况, labels = c("文科", "理科"))
先制作一个基本的数据。即高中某个班文理分科选择情况,27个人选择了文科,23个人选择了理科。
rep()
函数能够用来生成一个向量,向量里某个元素重复一定次数。
factor()
函数用来处理存储类型的变换,即将数据存储为因子类型的定类数据,标签用labels
参数来设定
ggplot(data = Scores, mapping = aes(x = 分科情况)) +
geom_bar()
下图是以上代码绘制而成的条形图,当然目前看起来还有些简陋,可以从颜色、主题背景等进行修饰。
ggplot(data = Scores, mapping = aes(x = 分科情况)) +
geom_bar(aes(fill = 分科情况 )) +
theme(panel.background