📣 前言
-
• 👓 可视化主要使用 matplotlib/seaborn
-
• 🔎 数据处理主要使用 pandas
-
• 🕷️ 数据爬取主要使用 requests
-
• 👉 本文是我自己在和鲸社区的原创
今天这篇文章将给大家介绍【数据分析汽车之家数据】 案例。
Step 1. 导入模块
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
#设置全局默认字体 为 雅黑
plt.rcParams['font.family'] = ['Microsoft YaHei']
# 设置全局轴标签字典大小
plt.rcParams["axes.labelsize"] = 14
# 设置背景
sns.set_style("darkgrid",{
"font.family":['Microsoft YaHei', 'SimHei']})
Step 2. 数据概览
数据下载:查看文章末尾获取。
data = pd.read_excel(r"/home/mw/input/car9730/汽车之家数据.xlsx")
data.head()
输出结果:
# 1. 查看数据集的基本信息
data_info = data.info()
# 2. 描述性统计
descriptive_stats = data.describe()
data_info, descriptive_stats
输出结果:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 24046 entries, 0 to 24045
Data columns (total 27 columns):
标题 24046 non-null object
价格 23641 non-null float64
新车含税价 24037 non-null object
标签 19118 non-null object
表显里程 24046 non-null object
上牌时间 24046 non-null object
挡位 24046 non-null object
排量 24046 non-null object
车辆所在地 24046 non-null object
查看限迁地 24046 non-null object
变速箱 24046 non-n