2024/7/21周报

摘要

本周阅读了一篇基于LSTM的旅游度假区餐饮顾客数量多变量时间序列预测方法的文章,文中构建了一种改进的旅游景区多元时间序列预测方法,提出了一种监督学习方法,通过结合天气状况、连续节假日等预期原因,构建单一时间序列数据来表征旅游需求的影响,并通过获得的时间序列数据(称为事件影响)来增强基于LSTM的多元时间序列预测。真实的数据的实验结果表明了该方法的有效性。

Abstract

This week, an article on the multivariate time series prediction method of the number of catering customers in tourist resorts based on LSTM is readed. In this paper, an improved multivariate time series prediction method of tourist attractions is constructed, and a supervised learning method is proposed. By combining weather conditions, continuous holidays and other expected reasons, a single time series data is constructed to represent the impact of tourism demand, and the obtained time series data (called event impact) is used to enhance the multivariate time series prediction based on LSTM. The experimental results of real data show the effectiveness of this method.

文献阅读

题目

An LSTM-based Multivariate Time Series Predicting Method
for Number of Restaurant Customers in Tourism Resorts

引言

旅游时间序列数据具有季节性和波动性,其非线性特征使得预测难度较大。这些数据被分类为多变量时间序列数据。LSTM(Long and Short Term Memory)是一种基于机器学习的时间序列数据预测算法,在许多应用领域都受到了广泛的关注,作者对LSLTM模型和ARIMA模型进行了比较,实验结果表明,在各自的实验条件下,LSTM模型的性能优于ARIMA模型。本文考虑了预测旅游度假区企业的客户数量或总销售额等业务需求。由于游客受到外界因素的影响,度假区内商店或餐馆的顾客数量是及时的和波动的。比如周末、连续节假日、一些特殊事件发生的日子游客增加。相反,在台风、大雨或大雪等恶劣天气条件下,游客减少。此外,旅游者的行为可能会受到SNS和网站时间信息的影响。与一般地方相比,旅游度假区对此类场合的依赖度应该更高。文中提出了一种基于LSTM的餐饮顾客数多元时间序列预测方法,两个真实的数据集上的实验结果表明本文方法有效。

本文贡献

1、提出了一个基于LSTM的多元时间序列预测框架,专注于预测旅游胜地餐厅的顾客数量。
2、使用监督学习方法构建单一时间序列数据来表示对旅游需求的影响,通过结合预期因素如天气条件、连续假期等。
3、通过实际数据的实验结果展示了该方法的有效性,并指出未来的研究方向是开发更适合多元时间序列的LSTM模型以及改进学习算法以构建事件影响信号。

多变量时间序列预测

与ARIMA等经典时间序列预测方法相比,LSTM模型可以轻松地对多个输入变量问题进行建模。在本节中,提出了基于LSTM的简单模型,处理以下问题:给定前几天的可用特征数据,预测第二天的客户数量。在数学上,用F表示具有K种时间序列数据的特征数据集,其中每种时间序列数据包括从时间0到T的数据点。
在这里插入图片描述

数据集

作者使用一个简单的LSTM模型进行多变量时间序列预测,在该模型中,预测t-1时的特征数据在第t天的旅游需求。作者在预处理阶段引入更多的特征,从原始给定的数据中产生,以利用时间序列的特性。在实验中,使用的实际数据提供了一个日本餐厅位于旅游胜地:每日顾客的数量、每日总销售额、预测的游客数量、美食网站的浏览量以及一周中的某一天。

除了原始数据之外,还利用了从原始数据生成的以下时间序列特征:一周前的客户数量,总销售额的每周移动平均值,一周中的日期。表1显示了所有数据集。有八个时间序列数据集,时间序列的范围是从“2017年7月1日”到“2020年3月31日”。在实验中,作者在时间序列预测的交叉验证意义上改变了训练和测试数据,其中训练数据的长度为一年,测试数据的长度为一个月。表2显示了详细信息。
在这里插入图片描述
在这里插入图片描述

实验设计

文中定义的LSTM模型,在第一个隐含层中有32个神经元,在输出层中有1个神经元,用于预测客户。输入数据最多包括八个特征,每个特征一个时间步长,即使它们包括时间序列特征,如移动平均和季节效应前一周的数据。使用均方差(MSE)作为损失函数,并使用自适应矩估计(Adaptive moment estimation,Adam)来优化参数。

Preliminary Experiments

使用下表1和表2所示的实际数据进行了实验,以调查预测的质量。首先,改变特征数据中的一组时间序列数据,图1显示了三种特征时间序列数据模式的R2误差精度。图2描述了从2018-09-07到2018-10-06的答案和预测值。

在这里插入图片描述
在这里插入图片描述

基于事件影响的增强预测

在本节中,提出了一种通过引入称为事件影响的时间序列数据来提高预测质量的方法。正如在上一节的初步实验中所观察到的,一般旅游需求是可预测的,但预测质量不稳定。原因是,特定的旅游需求可能会受到天气条件的强烈影响,如大雨或大雪,连续假期,度假胜地周围发生的吸引人的活动。有几个原因应该会影响游客的行为。作者将此类多个原因合并到一个时间序列数据中,并调用事件影响。
在这里插入图片描述

事件影响时间序列生成

在这里插入图片描述
在这里插入图片描述

实验评价

为了评估提出的增强方法的有效性,进行了一些实验。图3和图4描述了答案和预测之间的比较。带有“事件影响”的曲线表示对增强的预测。与简单的LSTM多变量模型相比,可以观察到结果更好。然而,在某些方面质量不够。例如,2019-09-14(在该地区附近有烟花事件)和2019-10-12(有强台风)显示出大幅高估和低估。
在这里插入图片描述
在这里插入图片描述

深度学习

VMD

变分模态分解(Variational Mode Decomposition,简称VMD)是一种用于信号处理和数据分析的算法,它能够将复杂的信号分解成一组更简单、更纯净的固有模态函数(IMFs)。VMD算法的目标是在保持各模态函数的中心频率清晰的同时,最小化这些模态之间的频谱重叠,从而实现信号的高效分解。

VMD算法原理

VMD算法基于变分原则,它试图找到一组模态函数,这些函数同时满足两个条件:

  1. 每个模态函数的频谱尽可能集中在一个中心频率周围。
  2. 不同模态函数的频谱尽可能不重叠。

VMD通过求解一个非凸优化问题来达到这个目标。这个问题可以通过交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)来解决,这是一种有效的数值优化方法。
在这里插入图片描述

VMD算法步骤

  1. 初始化:设置分解模态的数量K,以及每个模态函数的初猜中心频率。
  2. 更新模态函数:通过求解一个变分问题,更新模态函数,使其频谱集中在预设的中心频率附近。
  3. 更新中心频率:根据更新后的模态函数,重新估计每个模态函数的中心频率。
  4. 迭代:重复步骤2和3直到收敛,即模态函数和中心频率不再显著变化。

举例说明

假设我们有一个复合信号,由三个不同频率的正弦波组成:10Hz、50Hz和100Hz。这个信号可能来自于物理测量,比如振动监测中的传感器数据。

原始信号

在这里插入图片描述

应用VMD

如果我们使用VMD算法来分解这个信号,理论上,它应该能够识别出三个独立的模态函数,每个模态函数对应一个原始信号中的频率成分。

分解结果

  • 模态1:大约10Hz的正弦波
  • 模态2:大约50Hz的正弦波
  • 模态3:大约100Hz的正弦波

这样的分解可以帮助我们更好地理解信号的结构,例如在故障诊断中识别不同的振动模式,或者在生物医学信号处理中分离心跳和呼吸信号。

VMD与EMD比较

VMD与经验模态分解(Empirical Mode Decomposition,EMD)类似,但VMD在分解过程中考虑了模态函数的中心频率,因此在处理非线性、非平稳信号时更为稳定和精确。EMD可能会产生模态混合的问题,而VMD通过优化过程尽量避免了这一点。

优化方法

VMD使用交替方向乘子法(Alternating Direction Method of Multipliers, ADMM)来求解上述优化问题。ADMM是一种高效的优化算法,特别适用于解决大规模凸优化问题。在VMD的上下文中,ADMM允许将复杂的优化问题分解为一系列更容易处理的子问题,通过迭代更新模态函数和中心频率来逼近全局最优解。

更新规则
在每次迭代中,ADMM算法执行以下步骤:
在这里插入图片描述

这个过程会一直持续到收敛,即模态函数和中心频率的变化小于某个预定阈值。

总结

VMD通过求解一个精心设计的变分问题,有效地将信号分解为一组具有清晰中心频率的模态,这些模态在频域上是相对独立的。这种方法在处理非线性、非平稳信号时尤其有用,因为它能够提供更准确的频谱信息和更稳定的分解结果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值