本项目的数据集来源kaggle竞赛项目:HR-Analytics,自行下载即可!
1.提出问题
公司当中员工们离职的原因是什么?
什么样的员工会离职呢?
2.读取数据,理解数据
导入数据分析工具包,这次我们用seaborn库来优化我们的数据可视化图表!
读取数据
查看数据,head()方法没有指定默认查看前5行
查看数据是否存在缺失值以及数据类型
查看数据集是否有异常值
综上:本数据集有10个特征,8个数值特征,2个类别特征,共有14999条数据,都没有缺失,也没有发现异常值。
先备份数据,以免破坏源数据。