R数据科学—练习1.5答案

一、如果使用连续变量进行分面,会发生什么情况?

在这里插入图片描述
在这里插入图片描述
如果使用连续变量进行分面,几乎每一个具体的数值都会分为一个面,分面的版块数过多。

二、在使用facet_grid(drv~cyl)生成的图中,空白单元的意义是什么?它们和以下代码生成的图有什么关系?

ggplot(data=mpg)+
    geom_point(mapping=aes(x=drv,y=cyl))

1.空白单元的意义

在这里插入图片描述
![](https://i-blog.csdnimg.cn/direct/267d025475a04e0193adc9b55135a32d.png
在这里插入图片描述
(图1)
空白单元的意义是(以左下角空白单元格为例):不存在同时cyl为4,drv为r的观测

2.和以下代码的关系

在这里插入图片描述
图二
(图二)
图一将图二中的每一个点扩展成了一个单元,在单元中,横轴为displ,纵轴为hwy,相当于根据displ和hwy中的具体数值,将图二中的重合点抖开了。

三、以下代码会绘制出什么图?.的作用是什么?

ggplot(data = mpg)+
  geom_point(mapping = aes(x = displ,y = hwy))+
  facet_grid(drv~.)
 ggplot(data = mpg)+
  geom_point(mapping = aes(x = displ,y = hwy))+
  facet_grid(.~cyl)

在这里插入图片描述
在这里插入图片描述
.的作用是:
如果.位于波浪号的后方,则表示不会在列的水平上进行分面,只在行的水平上,根据波浪号之前的变量来进行分面;
如果.位于波浪号的前方,则表示不会在行的水平上进行分面,只在列的水平上,根据波浪号之后的变量来进行分面;

四、查看本节的第一个分面图:

ggplot(data = mpg)+
  geom_point(mapping = aes(x = displ,y = hwy))+
  facet_wrap(~class,nrow=2)

与使用图形属性相比,使用分面的优势和劣势分别是什么?如果有一个更大的数据集,你将如何权衡这两种方法的优劣?

在这里插入图片描述
在这里插入图片描述

1.与使用图形属性相比,使用分面的优势在于:可以除去其他分类的干扰,只观察某一个分类变量中的某一类的数据分布特点;劣势在于:无法观察该类分类变量与其他类别之间的分布关系。

2.如若数据集过大,根据图形属性很难发现特点,得出结论,应使用分面来具体观察某一分类的数据分布特点;如果使用图形属性能够很明晰地发现该分类与其他分类的相互关系和各自特点,使用图形属性来观察未尝不是一种很好的选择。

五、阅读?facet_wrap的帮助页面。nrow和ncol的功能分别是什么?还有哪些选项可以控制分面的布局?为什么函数face_grid没有变量nrow和ncol?

在这里插入图片描述

1.nrow是指分面后单元的行数;ncol是指分面后单元的列数;

2.还有as.table;drop等参数可以控制分面的布局;

3.函数facet_grid()没有变量nrow和ncol的原因是行数和列数分别是由波浪号前后的分类变量的分类数决定的。

六、在使用函数facet_grid()时,一般应该将具有更多唯一值的变量放在列上。为什么这么做呢?

1.屏幕空间利用:通常情况下,电脑显示器的宽度大于高度,因此将具有更多唯一值的变量放在列上可以更好地利用屏幕的宽度,使得每个子图之间的比较更为直观和方便;

2.减少滚动:如果将具有更多唯一值的变量放在行上,那么可能需要滚动才能查看所有的子图,这在用户体验上是不利的。而将具有更多唯一值的变量放在列上,可以减少滚动的需求,使得用户可以一眼看到更多的子图。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值