数据分析airbnb案例

该博客通过分析NYC的Airbnb数据,探讨了价格与其相关字段如neighbourhood, room_type, minimum_nights, availability_365等的关系。使用描述性统计和相关性分析,发现中位数小于平均值,且room_type与price的相关性需要数值化表示。通过数据清洗和分组分析,使用boxplot展示不同因素对价格的影响。最后,应用KNN回归模型预测房价,得到约39元的均方误差。" 132649270,19694693,C#泛型类型参数:编写可重用与类型安全的代码,"['C#', '泛型', '编程', '类型安全', '代码复用']

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Task:预测NYC的房屋价格

 

airbnb['price'].describe 对price字段的理解:

min为0,是真实数据抑或错误数据

max为10000,是真实数据抑或错误数据

中位数比平均值要小

用describe函数观察所有字段并对字段具体表示内容进行了解

 

先粗略分析price与哪个字段相关:

猜测:neighbourhood,room_type,mininum_nights,availability_365

airbnb.corr()

由于corr()只计算数值类型,所以难以体现room_type与price的相关性,需要进行转换

增加字段,用replace()将room_type转换为数值

 

数据清洗:

airbnb.info()

airbnb.isnull().sum()

可以用drop去掉与本次分析无关的列数据

 

airbnb.corr(method='kendall') 用肯德尔方法计算相关性系数

import matplotlib.pyplot as plt

plt.figure(figsize=(15,8))

sns.heatmap(corr,annot=True)

美国著名共享民宿网站 Airbnb 开放的民宿信息和住客评价数据,包括民宿的位置、房间、配置、价格、住客的评分和自然语言评论等。目前Airbnb开放数据的城市如下表所示。 城市名称 省份和地区 所在国家 Amsterdam North Holland The Netherlands Antwerp Flemish Region Belgium Asheville North Carolina United States Athens Attica Greece Austin Texas United States Barcelona Catalonia Spain Berlin Berlin Germany Boston Massachusetts United States Brussels Brussels Belgium Chicago Illinois United States Copenhagen Hovedstaden Denmark Denver Colorado United States Dublin Leinster Ireland Edinburgh Scotland United Kingdom Geneva Geneva Switzerland Hong Kong Hong Kong China London England United Kingdom Los Angeles California United States Madrid Comunidad de Madrid Spain Mallorca Islas Baleares Spain Manchester England United Kingdom Melbourne Victoria Australia Montreal Quebec Canada Nashville Tennessee United States New Orleans Louisiana United States New York City New York United States Northern Rivers New South Wales Australia Oakland California United States Paris France France Portland Oregon United States Quebec City Quebec Canada San Diego California United States San Francisco California United States Santa Cruz County California United States Seattle Washington United States Sydney New South Wales Australia Toronto Ontario Canada Trentino Trentino-Alto Adige_Südtirol Italy Vancouver British Columbia Canada Venice Veneto Italy Victoria British Columbia Canada Vienna Vienna Austria Washington D.C.District of Columbia United States
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值