现给到北京线上某款视频APP在2018年1月-2018年7月的实际用户数据,需要预测2018年8月-2019年12月的数据,请基于课程中的案例分析,建立分析方案并给到预测的数据结果。
日期 |
当月实际户数(户) |
2018.1 |
179 |
2018.2 |
199 |
2018.3 |
330 |
2018.4 |
450 |
2018.5 |
770 |
2018.6 |
821 |
2018.7 |
863 |
目标:
预测2018年8月-2019年12月的数据
问题分析:
该数据属于典型的时序数据。
历史数据量相对较少,且需要预测的未来数据量较多,不能简单以历史数据来对未来的数据进行预测,需要添加其他的外部变量进行辅助预测。
数据增长呈非线性趋势,可以采用线性、非线性建模进行对比。
不考虑那些单纯以自身历史数据预测自身未来数据的模型,如ARIMA、LSTM这类方法,最终选择多元非线性和线性回归两大类预测方法进行对比,通过模型评估指标选择最优模型。
非线性模型:
模型摘要和参数估算值 |
|||||||||