5、构建应用程序查找低价公寓

构建应用程序查找低价公寓

1. 数据检查与准备

在获取、解析数据并将其整合到 DataFrame 后,我们需要对数据进行清理和验证。首先,检查各列的数据点,查找异常值和离群值,从卧室和浴室列开始:

# 查看卧室列的唯一值
df['beds'].unique()
# 查看浴室列的唯一值
df['baths'].unique()

根据以上查询结果,发现部分值有前导下划线,需要进行修正:

df['beds'] = df['beds'].map(lambda x: x[1:] if x.startswith('_') else x)
df['beds'] = df['beds'].map(lambda x: x[1:] if x.startswith('_') else x)

再次检查卧室和浴室列的唯一值,确保前导下划线已被移除。接着,使用 describe 方法查看数据的描述性统计信息:

df.describe()

但结果未达到预期,原因是数据类型不正确,无法进行相关操作。因此,需要进一步清理数据并设置正确的数据类型:

df['rent'] = df['rent'].map(lambda x: str(x).replace('$','').replace(','
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值