下面是一个决策树与随机森林的应用实例。
问题1
下面有一个HR统计的关于员工离职率的CSV数据集,里面记录了员工的薪酬高低、工作时长、同时负责的项目数、是否离职等数据,数据已经数字或者标签化。
数据集的链接如下:员工离职因素数据集
试用决策树与随机森林分析数据集label元素之间的关系。
解答1
具体的解答可以参考:Decision Tree and Random forest.ipynb
下面是利用jupyter 运行代码的显示
问题2
下面有一个印第安人糖尿病患病情况的CSV数据集,里面记录了bmi,age,是否患糖尿病等数据,数据已经数字或者标签化。
数据集的链接如下:pima-indians-diabetes
试用决策树与随机森林分析数据集label元素之间的关系。