代码模板:
ggplot(data = <DATA>) +
<GEOM_FUNCTION>(mapping = aes(<MAPPINGS>))
例如:
ggplot(data = mpg)
得到的结果是一块空白的画布。
例如:
ggplot(data = mpg) +
geom_point(mapping = aes(x = hwy, y = cyl))
图形为:

上图作的是气缸数对每加仑油跑的里程数的散点图。基本上缸数越多,每加仑油跑的里程越少。
而假如代码如:
ggplot(data = mpg) +
geom_point(mapping = aes(x = class, y = drv))
因为class,drv都是定性变量,故散点图不是合适的图形。
在下图中,一组点(以红色突出显示)似乎落在线性趋势之外。 这些汽车的行驶里程比您预期的要高。 你怎么解释这些车?

ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy, color = class))

ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy, alpha = class))

ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy, shape = class))
ggplot2一次只能用6种形状,所以当你用shape这个参数的时候,多余的组默认不会画出来。
对于每个aesthetic对象,我们使用aes()将一个要展示的变量与这个aesthetic对象的名字联系起来。
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy), color = "blue")
上图种颜色并没有展示哪个变量,color这个参数放在aes()的外面。
解读ggplot2:可视化定性变量与多元关系
本文通过实例解析ggplot2在处理定量与定性数据时的应用,探讨如何选择合适的图形,如散点图与颜色、形状、透明度映射。重点在于理解aesthetic映射和为何某些组合不适合。
1219

被折叠的 条评论
为什么被折叠?



