SAC介绍:
pandas非常实用的SAC机制,SAC指的是分组操作中的Split-Apply-Combine 3个过程,分布代表数据的切割,应用和组合。
1、Split: 切割,就是通过某个指定的信息进行分组,生成不同的组别
2、Apply:应用,对不同的组别使用不同的功能函数,比如求和,求均值,最值等,可以是python,pandas的内置函数,也可以是自定义的函数。
3、Combine:组合,将Apply应用之后的结果再次组合在一起,得到最终的结果。
通常情况下,SAC过程都需要和groupby函数联合使用。
项目背景:磁盘故障可以根据其smart值进行监控和预测,smart值是反应磁盘特征的各种特征值,比如各种错误的频率。samrt值每天会产生一条数据。如图一,论文指出,故障磁盘的前n天其磁盘smart值会产生如图一的变化。
所以,根据其故障的变