业务来源:职工离职、用户流失这类问题一直是一个事后现象,如何提前预测出离职员工或流失用户就显得很重要。
脑图
分为两部分:一部分为现状分析,另一部分为算法预测

第一部分:在离职情况分析
1.数据采集
在职人员信息:20000+
选取特征【工号 所在机构 各部门 薪资水平 职级 性别 省份 进公司时间…】
离职人员信息:8000+
选取特征增加离职原因,离职时间两项
2.数据处理
【异常值替换】:
像进公司时间比公司成立还早的,这种根据工号的一个分布情况,统一替换成2016年。
像工作年限超出公司存在的时间,这个也是脏数据,数量不多,用平均工作年限替换。
3.python数据二次处理及简单出图
**常用开头**
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
import seaborn as sns
%matplotlib inline
看看整体情况
df=pd.read_csv('quit1.csv')
df.info()

本文分享了一次职工离职情况的数据分析实战经验,使用Python进行数据处理和初步分析,通过PowerBI展示结果。分析了在职和离职人员的特征,包括薪资水平、工作年限、省份和离职原因等。发现离职率与年龄、工作年限、晋升机会等因素密切相关,尤其年轻员工和高学历人才离职率较高,福建等省份离职人数较多。
最低0.47元/天 解锁文章
16





