1 任务
给定历史几年每个月的市场的车险保费值,预测下一个月车险保费。历史数据情况如下:
日期 | 保费 |
---|---|
2023-05 | 100.5亿 |
2023-06 | 109.1亿 |
… | … |
对于这样的任务,其实我们一般用自回归的序列模型比如sarimax,prophet等模型,最近由于DeepSeek-R1推理能力比较强,想看看它对这样任务的预测效果。尝试了给定历史序列数据,让大模型进行推理预测,但是发现预测的效果有点不稳定。后来对历史数据提取了一些不同维度的观察序列数据,让大模型对这些数据进行思考逻辑的强数学表达,再编程实现它的思路,发现效果整体可以,超出了预期。
2 基于DS的数学公式
2.1 特征处理
获取预测月份历史同比序列,环比序列,最近序列等不同维度数据。例如预测2025-01月保费
- 同比序列保费对应的时间周期是:[2024-01,2023-01,2022-01,…]
- 环比序列保费对应的时间周期是:[2024-12,2023-12,2022-12,…]
- 最近序列保费对应的时间周期是 :[2024-12,2024-11,2024-10,…]
春节序列保费对应的时间周期是:[2024-02,2023-01,2022-02,…] (对应历史春节所在的月份)
同比序列保费增长率计算:[(2024-01-2023-01)/2023-01, (2023-01-2022-01)/2022-01, …]
环比序列保费增长率计算: [(2024-01-2023-12)/2023-12, (2023-01-2022-12)/2022-12,…]
2.2 输入
2.3 方法
看着公式其实很简单,但是回测效果整体误差3%~4%之间,超出了预期,相比一些基准好的模型,效果也有一定提高。
3 感想
-
- 基于DS提供的数学公式化推理逻辑,然后编程实现他的逻辑,整体还不错。
-
- 从公式来看,数学表达很简单,当然这只是一个基础的版本,还有很大的优化空间。但是这个公式的好处是灵活性很强,能够从预测节点的不同时间维度观察数据的情况,并且通过方差来动态调整不同观察序列置信度,提高预测精准度
- 3.虽然公式简单,但是有很强的动态变化能力,若是可以抽取更多与目标预测相关的不同时间维度的序列特征,而且公式还有很多优化的空间,比如对实际的场景,外部政策事件消息等对目标的影响,这些也可加入公式化一项融合进来,以及权重通过一个更适应性的函数计算获得等等。