housing数据集中的total_bedrooms有部分缺失,对于缺失值,通常我们有以下几种方式处理:
- 放弃有缺失值的样本
- 放弃整个特征
- 将缺失值设置为某个默认值:0、平均值、中位数等。
pandas方式
通过DataFrame的dropna(), drop()和fillna()函数,可以方便的实现以上3个功能:
housing.dropna(subset=['total_bedrooms'])
housing.info()
housing.drop('total_bedrooms', axis