#######第四章:图形初阶#######
####1、使用ggplot2包创建图形####
#这一章数据用mosaicData包中CPS85数据框,
#这个数据框中包含1985年随机抽样的534个雇员样本
install.packages(c("mosaicData", "ggplot2"))
###1.1 函数ggplot()###
#最初,ggolot2图形只显示在白色参考线的灰色背景下
#ggplot()函数需要两组参数
#一个是数据框data,其中包含需要绘制的数据
#另一个是一组映射mapping,将数据进行图形可视化的操作,函数为aes(),表示为美化或可以看到的东西
#以下是第一段代码
library(ggplot2)
library(mosaicData)
ggplot(data = CPS85, mapping = aes(x = exper, y = wage))
#绘制的图中并没有什么,原因是我们指定了X轴和Y轴,但没有指定图中需要显示些什么
###1.2geom_函数###
#geom_图像是在背景上放置几何对象,包括点、线、条和阴影区域
#目前可用的geom_函数有37个,且数量还在增加,以下罗列出常用的geom_函数
geom_bar() #条形图 ##选项有:color, fill, alpha
geom_boxplot() #箱线图 ##选项有:color, fill, alpha, notch, width
geom_density() #核密度图 ##选项有:color, fill, alpha, linetype
geom_histogram() #直方图 ##选项有:color, fill, alpha, linetype, binwidth
geom_hline() #水平线图 ##选项有:color, alpha,linetype,size
geom_jitter() #抖动图 ##选项有:color, size, alpha, shape
geom_line() #线图 ##选项有:colorvalpha, linetype, size
geom_point() #散点图 ##选项有:color, alpha, shape, size
geom_rug() #地毯图 ##选项有:color, alpha
geom_smooth() #拟合曲线 ##选项有:method, formula, color, fill, linetype, size
geom_text() #文本注释 ##选项有:选项很多,详见帮助信息
geom_violin() #小提琴图 ##选项有:color, fill, alpha, linetype
geom_vline() #垂线 ##选项有:color, alpha,linetype,size
###geom_函数相当于让R知道在ggplot画布中需要画什么样子的图(John注)
#现在用geom_point()来创建散点图
#用+号和函数连接在一起创建图形
#代码如下
library(ggplot2)
library(mosaicData)
ggplot(data = CPS85, mapping = aes(x = exper, y = wage)) + geom_point()
#从图中可以看到,随着工作年限增加,工资也在增加,但是不明显
#同时可以看到一个异常值,所以需要对异常值进行处理
CPS85 <- CPS85[CPS85$wage < 40,]
ggplot(data = CPS85, mapping = aes(x = exper, y = wage)) + geom_point()
#geom_函数中可以指定很多选项,详见数第65页
??geom_point
#geom_point()函数可以指定4个选项,分别是:
#color, alpha, shape和size,分别为颜色、透明度、形状和大小
#颜色用通用名或十六进制代码指定
#形状与线条用相对应的名称或数字指定
#大小由0开始的正数指定,数字越大,图像越大
#透明度由0-1,指定,0为完全透明,1为完全不透明
#现在将上图调整图形稍微大一些,透明度调成半透明,颜色改为蓝色
#用theme将灰色背景改为白色(后续会再次讲解)
#代码如下:
ggplot(data = CPS85, mapping = aes(x = exper, y = wage)) +
geom_point(color = "cornflowerb