DataCastle租金预测数据竞赛个人总结2

本文详细介绍了DataCastle租金预测竞赛的个人实践,包括数据预处理、特征工程和模型选择。通过对房屋租金影响因素的深入分析,构建了LightGBM模型,并取得了MSE 1.5465的有效验证结果。

DataCastle租金预测数据竞赛个人总结2

竞赛链接
赛题任务
给定房屋租金价格的各个影响因素数据,建立模型预测国内某城市房屋的租金价格。训练集大小为196,539,测试集大小为56,279。
赛题详细介绍以及基础的数据预处理可跳转至个人总结1
Baseline

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')

import lightgbm as lgb
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
# 读取数据
train = pd.read_csv(r"C:\Users\Windows\Desktop\train.csv")
test = pd.read_csv(r"C:\Users\Windows\Desktop\test_noLabel.csv")
# 对object类型的特征“房屋朝向”进行离散化编码处理
orientation_headers = ['东', '南', '西', '北',
                       '东南', '西南', '西北', '东北']
def fill_orientation(item, orientation):
    x = item.split(' ')
    return 1 if orientation in x else 0
 
for i in orientation_headers:
    train[i] = train['房屋朝向'].apply(lambda x: fill_orientation(x, i))

for i in orientation_headers:
    test[i] = test['房屋朝向'].apply(lamb
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值