数据初探
首先导入要使用的科学计算包numpy,pandas,可视化matplotlib,seaborn,以及机器学习包sklearn。
二手房数据下载地址:链接:https://pan.baidu.com/s/1GGIbAf2ySdNOj9Hf9km-Pg 密码:f7am
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib as mpl
import matplotlib.pyplot as plt
from IPython.display import display
plt.style.use("fivethirtyeight")
sns.set_style({'font.sans-serif':['simhei','Arial']})
%matplotlib inline
# 检查Python版本
from sys import version_info
if version_info.major != 3:
raise Exception('请使用Python 3 来完成此项目')
然后导入数据,并进行初步的观察,这些观察包括了解数据特征的缺失值,异常值,以及大概的描述性统计。
本博客介绍了如何使用Python的科学计算包numpy和pandas,以及可视化工具matplotlib和seaborn进行二手房数据的初步探索。通过导入数据,观察特征的缺失值、异常值及描述性统计,为后续的数据分析和机器学习打下基础。
383

被折叠的 条评论
为什么被折叠?



