构建应用程序查找低价公寓
1. 数据检查与准备
在获取、解析数据并将其整合到 DataFrame 后,我们需要对数据进行清理和验证。首先,检查各列的数据点,查找异常值和离群值,从卧室和浴室列开始:
# 查看卧室列的唯一值
df['beds'].unique()
# 查看浴室列的唯一值
df['baths'].unique()
根据以上查询结果,发现部分值有前导下划线,需要进行修正:
df['beds'] = df['beds'].map(lambda x: x[1:] if x.startswith('_') else x)
df['beds'] = df['beds'].map(lambda x: x[1:] if x.startswith('_') else x)
再次检查卧室和浴室列的唯一值,确保前导下划线已被移除。接着,使用 describe 方法查看数据的描述性统计信息:
df.describe()
但结果未达到预期,原因是数据类型不正确,无法进行相关操作。因此,需要进一步清理数据并设置正确的数据类型:
df['rent'] = df['rent'].map(lambda x: str(x).replace('$','').replace(','
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



