25、数据可视化探索:多变量与分布分析

数据可视化探索:多变量与分布分析

1. 空间数据与多变量数据概述

1.1 空间数据探索

空间数据与分类数据类似,但包含地理成分。探索空间数据时,首先要了解数据范围,然后寻找区域模式。例如,思考在一个国家或大陆的特定区域内,是否存在较高或较低的值聚集。由于单个值只能反映一个有人居住区域的一小部分情况,所以要思考模式所暗示的含义,并参考其他数据集来验证推测。

1.2 多变量数据特点

数据通常以表格形式呈现,有多列,每列代表一个变量。可能包括来自多项问题的民意调查响应数据、测量系统多个方面的实验结果,或包含各国多方面信息的人口统计数据等。

2. 少量变量关系可视化

2.1 散点图展示变量关系

当有两个关于人、地点或事物的指标时,我们可能想知道一个指标如何随另一个指标变化。例如,高 burglary 率的城市是否也有高 homicide 率?房价与房屋面积之间有什么关系?每天喝更多汽水的人是否往往体重更重?

可以用类似于时间序列数据的方式可视化这些关系。在本章中,点图将时间放在横轴,变量放在纵轴,而散点图则用另一个变量代替时间,将两个变量相互绘制。以 2008 - 2009 年 NBA 篮球赛季为例,球员的使用百分比(球员在场上参与控球的估计百分比)绘制在横轴,每场得分绘制在纵轴。可以预期,控球时间更多的球员每场得分往往更多。

2.2 相关性与因果关系

变量之间的这种统计关系称为相关性。通常一个变量增加,另一个变量也会增加。在上述例子中,相关性在图表中很强且明显,但相关强度可能会有所不同。

需要注意的是,在探索

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值