泰坦尼克号数据集的数据分析与预测
1. 数据类型转换函数
除了 factor 函数外,还有更多类型转换函数:
| 数据类型 | 检测函数 | 转换函数 |
| ---- | ---- | ---- |
| 数值型 | is.numeric() | as.numeric() |
| 字符型 | is.character() | as.character() |
| 向量 | is.vector() | as.vector() |
| 矩阵 | is.matrix() | as.matrix() |
| 数据框 | is.data.frame() | as.data.frame() |
2. 检测缺失值
缺失值会降低样本的代表性,甚至可能扭曲对总体的推断。以下是检测泰坦尼克号数据集缺失值的步骤:
1. 使用 is.na 函数标记 Age 属性中包含 NA 值的索引:
is.na(train.data$Age)
- 计算
Age
超级会员免费看
订阅专栏 解锁全文
1071

被折叠的 条评论
为什么被折叠?



