机器学习笔记 - 时间序列预测研究：法国香槟的月销量

坐望云起

已于 2022-07-02 11:44:08 修改

阅读量1.2k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：深度学习从入门到精通文章标签：时间序列机器学习销量预测 ARIMA 季节性

于 2022-07-02 11:43:28 首次发布

本文链接：https://blog.youkuaiyun.com/bashendixie5/article/details/125570009

深度学习从入门到精通专栏收录该内容

797 篇文章 ¥99.90 ¥299.90

订阅专栏

这篇博客探讨了利用ARIMA模型预测法国香槟月销量的问题。通过数据集划分、数据分析，展示了时间序列的季节性和趋势。经过对数据的季节性差分和ARIMA模型的网格搜索，最终选择了ARIMA(0, 0, 1)模型，并进行了验证，得到了较好的预测结果。" 84260619,8178486,C#4.0 Task类深度解析与异步应用,"['C#编程', '异步编程', '并发控制', '.NET框架', '性能调优']

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、问题描述

问题是预测 Perrin Freres 标签（以法国的一个地区命名）的香槟月销量。该数据集提供了从 1964 年 1 月到 1972 年 9 月的香槟月销售量，或不到 10 年的数据。这些值是对数百万销售额的计数，有 105 个观察值。

链接：https://pan.baidu.com/s/1DyoZ_xFZeItCfrpX1RTG2g 
提取码：1f2u

将数据集下载为 CSV 文件，并将其放在当前工作目录中，文件名为“ champagne.csv ”。

2、划分数据集

假设现在是 1971 年 9 月，并在分析和模型选择中保留最后一年的数据。最后一年的数据将用于验证最终模型

下面的代码会将数据集作为 Pandas 系列加载并分成两部分，一个用于模型开发（dataset.csv），另一个用于验证（validation.csv）。

from pandas import read_csv
series = read_csv('champagne.csv', header=0, index_col=0, parse_dates=True, squeeze=True)
split_point = len(series

了解本专栏