时间序列分析与数据可视化:Python 中的实用技巧
时间序列分析
在时间序列分析中,我们可以采用不同的方法来处理数据。例如,我们可以使用 cut 函数根据员工的入职年份创建等宽区间并分组:
cuts = pd.cut(employee.index.year, bins=5, precision=0)
cuts.categories.values
输出结果如下:
array([Interval(1958.0, 1970.0, closed='right'),
Interval(1970.0, 1981.0, closed='right'),
Interval(1981.0, 1993.0, closed='right'),
Interval(1993.0, 2004.0, closed='right'),
Interval(2004.0, 2016.0, closed='right')], dtype=object)
然后,我们可以按这些区间和性别对员工的基本工资进行分组求均值:
employee.groupby([cuts, 'GENDER'])['BASE_SALARY'] \
.mean().unstack('GENDER').round(-2)
另外,
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



