《应用商务统计分析》第二章 方差分析(代码)

该报告详述了广州市商品房价格的影响因素分析,包括数据从链家网的爬取、分析流程如参数设置、数据清洗、描述性统计分析、重点进行了方差分析,并在最后进行了数据建模。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

广州市商品房价格影响因素分析报告

一、数据采集

链家网房价数据爬虫(github

 

二、分析流程github

0.参数设置

import pandas as pd
import numpy as np

import matplotlib.pyplot as plt

import statsmodels.api as sm
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

# print配置
str1 = '\n'*4 + '#'*80 
str2 = '\n'*2 + '-'*80 
str3 = '\n'*1 + '-'*40
# 画图
plt.rcParams['font.sans-serif']=['SimHei'] 

################ 0. 设置参数 #################
print(str1 + ' 0. 设置参数')

# 有效变量字典
xdict = {  'location0': '城区'
         , 'room_num': '户型种类数量'
         , 'type':'物业类型'
         , 'tag_num': '标签数量'  
#          , 'location1': '地理位置'
#          , 'city':'城市' 
      }
y = 'price' # '平均房价/元'           

# 其他参数
filepath =  u'houseprice_gz.csv' 
city_dict = {'广州': ['增城','花都','从化','南沙','荔湾','番禺','黄埔','天河','白云','海珠','越秀']
             , '佛山': ['禅城','顺德','高明','南海','三水']
             , '清远': ['清新区','清城区','英德市']      
            } # 城市

1. 数据采集

def get_data(path, index='name'):
    df = pd.read_csv(open(path, 'r', encoding
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值