数据分析:企业人力资源管理探索

本文探讨了企业员工流失问题,利用决策树、随机森林和GBM建模进行预测。发现经常加班、月收入低和工作等级是主要离职原因。经过加权优化,模型AUC达到0.7803。建议企业关注高离职风险的销售代表/业务人员,并深入研究离职因素,以改善人力资源管理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据分析:企业员工流失(二)

本文借鉴自公众号:R语言中文社区 Joffy Zhong所作的数据分析实例。

1.相关说明

  • 数据集:SAMPLE DATA: HR Employee Attrition and Performance
  • 分析语言:R
  • 涉及邻域:人力资源管理,员工流失问题

2.预测员工离职情况

2.1 利用决策树进行分析建模
#建模(决策树) 
set.seed(3221) 
 # 删除不需要的几个变量
 levels(Attr.df$JobRole) <- c("HC", "HR", "Lab", "Man", "MDir", "RsD", "RsSci", "SlEx", "SlRep")
 levels(Attr.df$EducationField) <- c("HR", "LS", "MRK", "MED", "NA", "TD")
 Attr.df <- Attr.df[c(-9,-10,-22,-27)]
 # 创建训练集和测试集
 n <- nrow(Attr.df)
 rnd <- sample(n, n * .70)
 train <- Attr.df[rnd,]
 test <- Attr.df[-rnd,]
 # 建模
 dtree <- rpart(Attrition ~., data = train)
 preds <- predict(dtree, test, type = "class")
 rocv <- roc(as.numeric(test$Attrition), as.numeric(preds))
 rocv$auc prop.table(table(test$Attrition, preds, dnn = c("Actual", "Predicted")),1)

这里写图片描述
AUC(曲线下面积)为0.6438,灵敏度(查全率)为0.333,数值均比较低,决策树模型或许得不到有用的结论,但其直观性还是可取的。

 dtreepr <- prune(dtree, cp = 0.016
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值