业务来源:职工离职、用户流失这类问题一直是一个事后现象,如何提前预测出离职员工或流失用户就显得很重要。
脑图
分为两部分:一部分为现状分析,另一部分为算法预测
第一部分:在离职情况分析
1.数据采集
在职人员信息:20000+
选取特征【工号 所在机构 各部门 薪资水平 职级 性别 省份 进公司时间…】
离职人员信息:8000+
选取特征增加离职原因,离职时间两项
2.数据处理
【异常值替换】:
像进公司时间比公司成立还早的,这种根据工号的一个分布情况,统一替换成2016年。
像工作年限超出公司存在的时间,这个也是脏数据,数量不多,用平均工作年限替换。
3.python数据二次处理及简单出图
**常用开头**
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
import seaborn as sns
%matplotlib inline