一、因子
1.变量可分为名义型(没有顺序之分的类别变量),有序型(表示一种顺序关系而非数量关系),连续型(可以呈现某个范围内的任意值,并同时表示顺序和数量)
2.类别变量和有序类别变量在R中称为因子,函数factor()以一个整数向量的形式存储类别值,要表示有序型变量,需要为函数factor()指定参数ordered = TRUE,对于字符型向量,因子的水平默认依字母顺序创建,可以通过指定levels选项来覆盖默认顺序,保证指定的水平与数据中的真实值相匹配,任何在数据中出现而未在参数中列举的数据都将被设为缺失值。
在R中无法用//解释一行语句,str(patientdata)意思是显示对象的结构。

summary(patientdata) 表示显示对象的统计概要

summary()显示了连续型变量最小最大均值mean和各四分位数(1st Qu,median,3rd Qu,四分位数(Quartile)也称四分位点,是指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。
举例:
数据总量: 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36
由小到大排列的结果: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49
一共11项
Q1 的位置=(11+1) × 0.25=3, Q2 的位置=(11+1)× 0.5=6, Q3的位置=(11+1) ×

本文介绍了R语言中的因子数据类型,包括名义型和有序型变量的处理,以及如何使用factor()函数创建和管理因子。此外,还探讨了列表的复杂性,以及如何通过list()函数创建和访问列表组件。同时讲解了统计概要中的四分位数计算方法。
最低0.47元/天 解锁文章
891

被折叠的 条评论
为什么被折叠?



