数据统计基础:单变量与多变量分析及常用统计量计算
1. 单变量与多变量数据
在数据分析中,我们会遇到不同类型的数据。当我们讨论或分析仅与一个维度相关的数据时,处理的就是单变量数据。例如,之前例子中的体重变量就是单变量的,因为每个测量值都可以用一个单一的数字来表示。
而当需要考虑与多个维度的变量相关的数据时,即每个观测值有多个组成部分或测量值时,这些数据就是多变量数据。多变量测量在单个组成部分在统计分析中单独考虑时不太有用的情况下尤为重要。
以空间坐标为例,它至少需要两个组成部分来描述:水平的 x 坐标和垂直的 y 坐标。仅考虑单变量数据(如仅 x 轴的值)并没有太大的用处。
下面我们来看 quakes 数据集,它包含了斐济海岸附近记录的 1000 次地震事件的观测数据。我们可以查看前 5 条记录:
R> quakes[1:5,]
lat long depth mag stations
1 -20.42 181.62 562 4.8 41
2 -20.62 181.03 650 4.2 15
3 -26.00 184.10 42 5.4 43
4 -17.97 181.66 626 4.1 19
5 -20.42 181.96 649 4.0 11
这个数据集中, lat 和 long 列分别提供了事件的纬度和经度, depth 列提供了事件的深度(以千米为单位),
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



