使用R创建表格和图表
1. 频率分布和表格
在数据分析中,频率分布是非常重要的工具,它可以让我们直观地了解数据的分布情况。使用R语言,我们可以很方便地生成频率分布表和图表。 table()
函数是生成简单频率分布的主要工具。当我们有大量数据点时,创建分组频率分布可以帮助我们更好地理解数据。
例如,假设我们有一个名为 faithful
的数据集,它包含黄石国家公园老忠实间歇泉的喷发持续时间和喷发间隔时间。我们可以使用 table()
函数生成简单的频率分布:
> head(faithful)
eruptions waiting
1 3.600 79
2 1.800 54
3 3.333 74
4 2.283 62
5 4.533 85
6 2.883 55
> table(faithful$waiting)
由于数据点较多,简单频率分布可能不够直观。我们可以创建分组频率分布,具体步骤如下:
- 使用
seq()
函数生成区间边界。 - 使用
cut()
函数将数据划分为区间。 - 使用
table()
函数生成分组频率分布。
以下是具体的代码实现: