文章目录
想要看更加舒服的排版、更加准时的推送
关注公众号“不太灵光的程序员”
干货推送,微信随时解答你的疑问 😃😃😃
数据挖掘前我们要去熟悉数据,了解变量间的相互关系以及变量与预测值之间的存在关系,借助可视化工具帮助我们更好的进行分析。
根据赛题代码要求创建了目录,下载数据我们可以发现,已经区分了训练集和测试集。
下面我们一起来分析二手车交易数据。
1. 载入各种数据科学以及可视化库
- 数据科学库 pandas、numpy、scipy;
- 可视化库 matplotlib、seabon;
没有安装的 使用 pip install 安装
# coding=gbk
import numpy as np
import pandas