1 目标变量为数值变量
1.1 单变量描述
1.1.1 方法云集
- summary() 函数
summary()函数为由R自带基础包提供。该函数提供了最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计。
其格式为:
summary(data1$var1)
- Hmisc包的describe()函数
Hmisc包中的describe()函数可返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数,以及五个最大的值和五个最小的值。
其格式为
library(Hmisc)
describe(data1$var1)
- pastecs包的stat.desc()的函数
pastecs包中有一个名为stat.desc()的函数,它可以计算种类繁多的描述性统计量。使用格式为:
library(pastecs)
stat.desc(data,basic = TURE,desc = TURE,norm ==FALSE,p=0.95)
(1)其中的data是一个数据框。
若basic=TRUE(默认值),则计算其中所有值、空值、缺失值的数量,以及最小值、最大值、值域,还有总和。
(2)若desc=TRUE(同样也是默认值),则计算中位数、平均数、平均数的标准误、平均数置信度为95%的置信区间