文章目录
公众号/小红书: 快乐数模
优快云: 清上尘
本文,我们将讨论单变量、双变量和多变量数据及其分析。
一、单变量数据
1.1 单变量数据
单变量数据是指每个观察值或数据点对应单个变量的一种数据类型。换句话说,它涉及对数据集中每个个体或项目的单个特征或属性的测量或观察。分析单变量数据是统计学中最简单的分析形式。
身高(厘米) | 164 | 167.3 | 170 | 174.2 | 178 | 180 |
---|
假设记录了一个班上七名学生的身高(上表),只有一个变量,即身高,并且不处理任何原因或关系。
1.2 单变量分析的要点:
无关系: 单变量分析仅侧重于描述和总结单个变量的分布。它不探索变量之间的关系或尝试找出原因。
描述性统计: 描述性统计,例如集中趋势测量(平均值、中位数、众数)和离散度测量(范围、标准差),通常用于单变量数据的分析。
可视化: 通常使用直方图、箱线图和其他图形表示来直观地表示单个变量的分布。
二、双变量数据
2.1 双变量数据
双变量数据涉及两个不同的变量,这种类型的数据分析侧重于了解这两个变量之间的关系或关联。双变量数据