北京二手房数据分析

该博客旨在分析北京二手房数据,包括价格、Size、户型、装修状况、是否有电梯、建造年份和楼层等特征。通过数据预处理、特征创建(如PerPrice)和可视化,揭示各地区房价差异,Size的离散值处理,以及不同因素如何影响房价。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目的

本案例得目标主要对数据集中的特征进行量化分析,并且通过图形可视化进行展示出来。项目数据来源于链家北京二手房数据。

数据预处理

首先导入分析过程中可能运用到的函数包,并读取显示前10行数据。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib as mpl
import seaborn as sns
from IPython.display import display
%matplotlib inline

lianjia_df=pd.read_csv('lianjia.csv')
lianjia_df.head(10)

前10行数据结果显示如下所示
在这里插入图片描述
然后对数据的基本信息进行查看

lianjia_df.index
lianjia_df.columns
lianjia_df.info()

以上三条代码分别显示如下
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
再对数据进行描述性统计

lianjia_df.describe()

在这里插入图片描述
新建特征PerPrice,其值等于房价除以面积,并显示前10行数据

df=lianjia_df.copy()
df['PerPrice']=lianjia_df['Price']/lianjia_df['Size']
df[:10]

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值