02:时间序列规则

Task02:时间序列规则

时间序列法是一种统计分析方法,在宣传工作中根据一定时间的数据序列预测未来发展趋势的方法。亦称时间序列趋势外推法。这种方法适用于处于连续过程中的事物的预测。它需要有若干年的数据资料,按时间序列排列成数据序列,其变化趋势和相互关系要明确和稳定。

针对周期因子的优化

按列提取中位数是一种简单而有效的提取周期因子的方法。中位数十分鲁棒,不受极端值的影响。但中位数损失了很多信息。实践中,可以在此基础上进一步优化。比如可以提取一个均值和一个中位数,然后将均值和中位数融合。融合的比例按照测试集的表现来确定。也可以根据与预测周的时间距离来赋予不同的权重。

针对base的优化

预测第四周每天的客流量,直接用最后一周的平均客流量作为base并不一定是最好的方法。也许最后三天或最后五天的均值能更好的反映最新的情况。但是,我们不能直接对最后三天客流量取均值(最后三天是周末,这样取的base就偏大了)。需要去掉周期性因素后,再取平均。具体做法,就是用客流量除以周期因子。

线性回归-利用时间特征做线性回归

提取时间的周期性特点做为特征,此时训练集每条样本为"时间特征->目标值",时间序列的依赖关系被剔除,不需要严格依赖滑窗截取训练样本。常见是将时间用0-1哑变量表达,有以下若干种特征:

将星期转化为了0-1变量,从周一至周天,独热编码共7个变量
将节假日转化为0-1变量,视具体节假日数目,可简单分为两类,“有假日”-“无假日”,独热编码共2个变量;或赋予不同编码值,如区分国庆、春节、劳动节等使用1、2、3表示
将月初转化为0-1变量,简单分两类表示为"是月初"-“非月初”,共2个特征
类似的月中、月初可以转化为0-1变量
控制时间粒度,区分是weekday or weekend

观察序列,当序列存在周期性时,线性回归也可做为baseline

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值