Python 和Pandas数据可视化分析 HR Data Descriptive & Prediction Analysis

本文利用Python的Pandas库对一万多条人力资源数据进行深入分析,探讨工资、职业、月工时、满意度、离职率、升职等变量之间的关系。通过数据读取、缺失值检查、分组聚合以及可视化方法,揭示了IT和marketing高薪岗位工作时间相对较短、研发部门工资越高满意度越低、月工时与离职率的关联、项目数与升职机会的矛盾以及司龄、月工时与离职率的复杂联系。文章还展示了如何利用value_counts函数统计职业分布,并给出了绘制子图的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

下载数据集:网址

链接:https://pan.baidu.com/s/178jLtzT1vpkHiIO6QBfPwQ 
提取码:xjku 

本篇文章是利用Python 和Pandas对人力资源数据集进行分析。共一万多条数据

问题:工资,职业,月工时,满意度,是否离职(0-在职 1-离职),升职(0 没有升职,1升职),项目数之间有什么关系?

首先要导入需要的库:

mport numpy as np
import pandas as pd
import matplotlib.pyplot as plt

读入数据:

# 1.读入数据
data = pd.read_csv('./data/HR.csv', sep=',', encoding='gbk')
print(data.head())

结果:

   satisfaction_level  last_evaluation  ...  sales  salary
0                0.38             0.53  ...  sales     low
1                0.80             0.86  ...  sales  medium
2                0.11             0.88  ...  sales  medium
3                0.72             0.87  ...  sales     low
4                0.37             0.52  ...  sales     low

[5 rows x 10 columns]

查看sales的类别,包括哪些工作类型

sales_unique = data.sales.unique()
print(sales_unique)

结果:

['sales' 'accounting' 'hr' 'technical' 'support' 'management' 'IT'
 'product_mng' 'marketing' 'RandD']

查看数据有无缺失值

data.info()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值