使用R语言统计DataFrame中离散变量数据列的水平个数

本文链接：https://blog.youkuaiyun.com/PixelLoom/article/details/132573014

本文介绍如何在R语言中使用`table()`和`length()`函数统计DataFrame中离散变量数据列的水平个数，通过示例代码详细展示了操作过程。

使用R语言统计DataFrame中离散变量数据列的水平个数

在数据分析和统计中，我们经常需要对数据进行描述性统计和分析。当处理包含离散变量的数据时，我们可能需要知道每个变量具有多少个不同的水平。在R语言中，可以使用unique函数和length函数来实现这个目标。

首先，我们需要加载所需的数据集。假设我们有一个名为df的DataFrame，其中包含了离散变量数据列。现在让我们来看看如何使用unique函数和length函数来统计每个离散变量数据列的水平个数。

以下是一个示例代码：

# 创建一个示例DataFrame
df <- data.frame(
  var1 = c('A', 'B', 'A', 'C', 'B'),
  var2 = c('X', 'Y', 'Y', 'Z', 'X'),
  var3 = c('M', 'N', 'N', 'M', 'N')
)

# 统计每个离散变量数据列的水平个数
levels_var1 <- length(unique(df$var1))
levels_var2 <- length(unique(df$var2))
levels_var3 <- length(unique(df$var3))

# 输出结果
print(levels_var1)  # 输出var1的水平个数
print(levels_var2)  # 输出var2的水平个数
print(levels_var3)  # 输出var3的水平个数