利用HR数据进行数据描述统计和可视化

本文基于《数据分析与挖掘建模实战》,利用HR.csv数据进行描述统计和可视化分析。涉及偏态系数、峰态系数等统计概念,以及异常值、对比分析和分布分析。并介绍了数据分类,如定类、定序、定距和定比数据。文章还探讨了不同类型的图表,如柱状图、直方图、箱线图、折线图和饼图在可视化中的应用,特别关注了员工离职率与在公司时间的关系。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

《数据分析与挖掘建模实战》

利用HR.csv数据进行实际操作

一、描述统计

import pandas as pd   #引入pandas模块
df=pd.read_csv("HR.csv")   #导入HR.csv数据
df.mean()   #求均值
df["satisfaction_level"].mean()  #求其中一个变量的均值
df.median() #求中位数
df.quantile(q=0.25)  #求四分位数 q可以等于0.25、0.5、0.75
df.mode()  #求众数
df.std()  #标准差
df.var()   #方差
df.sum()   #求和
df.skew()  #偏态系数
df.kurt()  #峰度
df.sample(n=10)  #抽取10个样本
df.sample(frac=0.001)    #抽取0.001%

偏态系数:数据平均值的偏离程度,为正则是正偏,数据的平均值比中位数大;为负时平均值比中位数小。

峰态系数:数据的集中趋势,越小越不集中,越大越集中

三大分布:标准正态分布,卡方分布,t分布,F分布。要引入scipy.stats

import scipy.stats as ss  #导入scipy.stats包
ss.norm  #正态分布
ss.norm.stats(moments="mvsk")  #正态分布的均值m,方差v,偏态系数s,峰度系数k
ss.norm.pdf(0.0)  #标准正态分布给出横坐标,求出纵坐标的值
ss.norm.ppf(0.9)  #从-∞积分到多少是0.9
ss.norm.cdf(2)  #从-∞积分到2的面积是多少
ss.norm.cdf(2)-ss.norm.cdf(-2)
ss.norm.rvs(size=10)  #得到十个正态分布的数字
ss.chi2 #卡方分布
ss.t  #t分布
ss.f  #F分布

二、数据分类:定类数据、定序数据、定距数据(没有绝对零点,乘法除法无意义)、定比数据

三、单属性分析

异常值分析:连续异常值、离散异常值、知识异常值

对比分析:从时间、空间、计划与经验来对比分析

结构分析:

分布分析:直接获得概率分布、是不是正态分布、极大似然

import pandas as pd
import numpy as np
df=pd.read_csv(HR.csv)
sl_s=df["satisfaction_level"]
sl_s.isnull()  #列出有没有异常值
sl_s[sl_s.isnull()]  #找出异常值
df[df["satisfaction_level"].isnull()]  #查看异常值
sl_s=sl_s.dropna()  #舍弃异常值
np.histogram(sl_s.values,bins=n
推荐,HR人力资源的数据思维工具包合集,共40份。 一、数据分析PPT 【绩效】绩效管理数据分析 【培训】培训数据分析报告(PPT-63页) 【述职】HR年底漂亮的述职报告模板(拿来即用) 【通用】人力资源常用分析数据 【通用】人力资源数据分析 【通用】数据分析师培训(1) 【通用】数据分析师培训(2) 【通用】数据分析师培训(3) 【通用】HR管理数据分析-基础篇 【薪酬】龙湖地产企业薪酬数据分析报告 【招聘】招聘数据分析报告 【培训】大数据时代的人力资源管理 【通用】大数据与人力资源管理 【通用】企业人力资源数据分析 【通用】人力资源数据中心建设探讨 二、数据分析表格 部门绩效考核统计分析表 工作周报数据分析表excel模板 公司人力成本分析表(siow) 年度入职与离职人员统计 培训看板 人力资源汇总表(基础数据、结构分析、离职分析、保险、费用、绩效等) 人力资源结构分析表 人力资源结构分析表 人力资源数据分析指标 人力资源统计分析表 人力资源预算分析表 人事信息看板 人员业绩分析表 人员业绩分析表Excel图表 入离职数据分析更新版 薪酬看板 薪酬总额测算表(部门) 员工离职统计及分析表 员工入职统计及分析表 员工招聘、离职成本核算表 月度绩效指标及月度绩效分析表 招聘看板 招聘员工统计分析表 招聘员工统计分析Excel表格 HR月分析数据模板
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值