本文通过业务的角度利用时间序列的方式对水表使用量进行分析和预测,不涉及专业的算法知识,而是对一年内三百多条用水量数据分析,找寻其中的规律,在分析的过程中逐渐意识到自己使用的其实是时间序列的方式,因为用水量的改变与时间有着很紧密的关联,例如工作日、双休、节假日、调休、加班都会影响用水量,从而影响趋势预测数据的准确性。
数据预测方式
预测数据趋势一般有以下几种方式:
线性回归:适合平稳上升的数据类型,找到一条最佳拟合直线,来描述自变量和因变量之间的线性关系,进而预测趋势。
移动平均法:适合数据量基本不变的情况,通过计算一定窗口大小内数据的平均值,平滑数据序列,以此观察数据的大致走向。
多项式回归:当数据的趋势不是简单的直线关系时,多项式回归使用多项式函数拟合数据,捕捉更复杂的曲线趋势。
时间序列分析:自回归综合移动平均模型(ARIMA)常用于分析时间序列数据,通过对数据的自回归、差分和移动平均处理,预测未来值。
数据内容分析
由于数据未脱敏不能进行展示,通过观察日期/星期对应的使用量趋势,可以看出来在工作日的用水量明显较大,而双休日的用水量较少。

在下图中则可以看出来,同样是星期日的4月28号则用水量很高,是因为4月28号那天需要为五一放假调休补班,所以用水量和正常上班保持一致

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



