数据的统计分析分为描述性统计分析和统计推断两部分, 前者又称为探索性统计分析, 它是通过绘制统计图形、编制统计表格、计算统计量等方法来探索数据的主要分布特征, 揭示其中存在的规律. 探索性数据分析是进行后期统计推断的基础.
本文着重于数据集的数字化探索。程序包DAAG中有内嵌数据集“possum”,它包括了从维多利亚南部到皇后区的七个地区的104只负鼠(possum)的年龄、尾巴的长度、总长度等14个特征值,选用这套数据集进行分析。
#数据概况
library(DAAG)
data(possum)
nrow(possum) #显示数据集的行、列、维度
ncol(possum)
dim(possum)
head(possum) #显示数据集的前若干条
attributes(possum) #获取数据集属性列表
str(possum) #获取数据样本数、变量数、各变