时间序列分析与数据可视化:Python 实践指南
时间序列分析
员工数据分组新方法
在处理员工数据时,我们可以采用一种全新的方式进行分组。利用 cut 函数,依据员工的入职年份创建等宽区间,进而形成不同的分组。以下是具体代码示例:
cuts = pd.cut(employee.index.year, bins=5, precision=0)
cuts.categories.values
运行上述代码后,我们将得到如下的区间数组:
array([Interval(1958.0, 1970.0, closed='right'),
Interval(1970.0, 1981.0, closed='right'),
Interval(1981.0, 1993.0, closed='right'),
Interval(1993.0, 2004.0, closed='right'),
Interval(2004.0, 2016.0, closed='right')], dtype=object)
接着,我们可以按照这些分组和性别对员工的基本工资进行分组求均值,并进行相应的格式处理:
employee.groupby([cuts, 'GENDER'])['BASE_SALARY'] \
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



