拿到一个数据集后,一般需要对数据的概貌有一个了解,类似于变量名称、类型、缺失值情况、
1、ls() 获取当前工作区内的数据集
2、dim(plants) 获取当前数据集中有多少行和多少列
3、nrow(plants) 仅获取数据集中有多少行
4、object.size(plants) 获取当前数据集所占内存
5、names(plants) 调取对应数据集的列名
6、head() 获取 默认前六行数据,如果要设置看到头10行,则设置为
head(plants,10)
7、tail(plants) 获取默认倒数10行数据,tail(plants,15) 获取倒数15行数据
8、summary(plants),会对数据集plants进行总体呈现,针对字符型字段,进行分类汇总,针对数值型字段,呈现各分为段的值。
9、针对某个字段进行分类汇总统计,table(plants$active_growth_period)
10、若要整体了解该数据集,其实str()最能呈现该数据集的全貌