房租预测

该博客探讨了房租预测问题,首先介绍了数据的载入和预览,接着分析了label(房租价格)的分布,特别是对异常值进行了处理。然后,博客详细检查了数据的变量类型,将数值型和离散型特征区分开,并对数值变量的分布进行了深入研究,为后续的预测模型建立奠定了基础。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

房租预测

载入库与数据读取

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import sys
train_data = pd.read_csv('train_data.csv')
test_data  = pd.read_csv('test_a.csv')

数据的预浏览

# 查看训练集以及测试集维度
print('train:',train_data.shape)
print('test:',test_data.shape)
# 查看两组变量的差别(差别为目标变量)
for var in train_data.columns:
    if var not in test_data.columns:
        print(var)
# 查看训练特征
print(train_data.columns)
# 查看每个变量的的情况
def get_null(df):
    for var in df.columns:
        if df[var].isnull().sum()>0:
            print(var
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值