2024/7/21周报

摘要

本周阅读了一篇基于LSTM的旅游度假区餐饮顾客数量多变量时间序列预测方法的文章,文中构建了一种改进的旅游景区多元时间序列预测方法,提出了一种监督学习方法,通过结合天气状况、连续节假日等预期原因,构建单一时间序列数据来表征旅游需求的影响,并通过获得的时间序列数据(称为事件影响)来增强基于LSTM的多元时间序列预测。真实的数据的实验结果表明了该方法的有效性。

Abstract

This week, an article on the multivariate time series prediction method of the number of catering customers in tourist resorts based on LSTM is readed. In this paper, an improved multivariate time series prediction method of tourist attractions is constructed, and a supervised learning method is proposed. By combining weather conditions, continuous holidays and other expected reasons, a single time series data is constructed to represent the impact of tourism demand, and the obtained time series data (called event impact) is used to enhance the multivariate time series prediction based on LSTM. The experimental results of real data show the effectiveness of this method.

文献阅读

题目

An LSTM-based Multivariate Time Series Predicting Method
for Number of Restaurant Customers in Tourism Resorts

引言

旅游时间序列数据具有季节性和波动性,其非线性特征使得预测难度较大。这些数据被分类为多变量时间序列数据。LSTM(Long and Short Term Memory)是一种基于机器学习的时间序列数据预测算法,在许多应用领域都受到了广泛的关注,作者对LSLTM模型和ARIMA模型进行了比较,实验结果表明,在各自的实验条件下,LSTM模型的性能优于ARIMA模型。本文考虑了预测旅游度假区企业的客户数量或总销售额等业务需求。由于游客受到外界因素的影响,度假区内商店或餐馆的顾客数量是及时的和波动的。比如周末、连续节假日、一些特殊事件发生的日子游客增加。相反,在台风、大雨或大雪等恶劣天气条件下,游客减少。此外,旅游者的行为可能会受到SNS和网站时间信息的影响。与一般地方相比,旅游度假区对此类场合的依赖度应该更高。文中提出了一种基于LSTM的餐饮顾客数多元时间序列预测方法,两个真实的数据集上的实验结果表明本文方法有效。

本文贡献

1、提出了一个基于LSTM的多元时间序列预测框架,专注于预测旅游胜地餐厅的顾客数量。
2、使用监督学习方法构建单一时间序列数据来表示对旅游需求的影响,通过结合预期因素如天气条件、连续假期等。
3、通过实际数据的实验结果展示了该方法的有效性,并指出未来的研究方向是开发更适合多元时间序列的LSTM模型以及改进学习算法以构建事件影响信号。

多变量时间序列预测

与ARIMA等经典时间序列预测方法相比,LSTM模型可以轻松地对多个输入变量问题进行建模。在本节中,提出了基于LSTM的简单模型,处理以下问题:给定前几天的可用特征数据,预测第二天的客户数量。在数学上,用F表示具有K种时间序列数据的特征数据集,其中每种时间序列数据包括从时间0到T的数据点。
在这里插入图片描述

数据集

作者使用一个简单的LSTM模型进行多变量时间序列预测,在该模型中,预测t-1时的特征数据在第t天的旅游需求。作者在预处理阶段引入更多的特征,从原始给定的数据中产生,以利用时间序列的特性。在实验中,使用的实际数据提供了一个日本餐厅位于旅游胜地:每日顾客的数量、每日总销售额、预测的游客数量、美食网站的浏览量以及一周中的某一天。

除了原始数据之外,还利用了从原始数据生成的以下时间序列特征:一周前的客户数量,总销售额的每周移动平均值,一周中的日期。表1显示了所有数据集。有八个时间序列数据集,时间序列的范围是从“2017年7月1日”到“2020年3月31日”。在实验中,作者在时间序列预测的交叉验证意义上改变了训练和测试数据,其中训练数据的长度为一年,测试数据的长度为一个月。表2显示了详细信息。
在这里插入图片描述
在这里插入图片描述

实验设计

文中定义的LSTM模型,在第一个隐含层中有32个神经元,在输出层中有1个神经元,用于预测客户。输入数据最多包括八个特征,每个特征一个时间步长,即使它们包括时间序列特征,如移动平均和季节效应前一周的数据。使用均方差(MSE)作为损失函数,并使用自适应矩估计(Adaptive moment estimation,Adam)来优化参数。

Preliminary Experiments

使用下表1和表2所示的实际数据进行了实验,以调查预测的质量。首先,改变特征数据中的一组时间序列数据,图1显示了三种特征时间序列数据模式的R2误差精度。图2描述了从2018-09-07到2018-10-06的答案和预测值。

在这里插入图片描述
在这里插入图片描述

基于事件影响的增强预测

在本节中,提出了一种通过引入称为事件影响的时间序列数据来提高预测质量的方法。正如在上一节的初步实验中所观察到的,一般旅游需求是可预测的,但预测质量不稳定。原因是,特定的旅游需求可能会受到天气条件的强烈影响,如大雨或大雪,连续假期,度假胜地周围发生的吸引人的活动。有几个原因应该会影响游客的行为。作者将此类多个原因合并到一个时间序列数据中,并调用事件影响。
在这里插入图片描述

事件影响时间序列生成

在这里插入图片描述
在这里插入图片描述

实验评价

为了评估提出的增强方法的有效性,进行了一些实验。图3和图4描述了答案和预测之间的比较。带有“事件影响”的曲线表示对增强的预测。与简单的LSTM多变量模型相比,可以观察到结果更好。然而,在某些方面质量不够。例如,2019-09-14(在该地区附近有烟花事件)和2019-10-12(有强台风)显示出大幅高估和低估。
在这里插入图片描述
在这里插入图片描述

深度学习

VMD

变分模态分解(Variational Mode Decomposition,简称VMD)是一种用于信号处理和数据分析的算法,它能够将复杂的信号分解成一组更简单、更纯净的固有模态函数(IMFs)。VMD算法的目标是在保持各模态函数的中心频率清晰的同时,最小化这些模态之间的频谱重叠,从而实现信号的高效分解。

VMD算法原理

VMD算法基于变分原则,它试图找到一组模态函数,这些函数同时满足两个条件:

  1. 每个模态函数的频谱尽可能集中在一个中心频率周围。
  2. 不同模态函数的频谱尽可能不重叠。

VMD通过求解一个非凸优化问题来达到这个目标。这个问题可以通过交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)来解决,这是一种有效的数值优化方法。
在这里插入图片描述

VMD算法步骤

  1. 初始化:设置分解模态的数量K,以及每个模态函数的初猜中心频率。
  2. 更新模态函数:通过求解一个变分问题,更新模态函数,使其频谱集中在预设的中心频率附近。
  3. 更新中心频率:根据更新后的模态函数,重新估计每个模态函数的中心频率。
  4. 迭代:重复步骤2和3直到收敛,即模态函数和中心频率不再显著变化。

举例说明

假设我们有一个复合信号,由三个不同频率的正弦波组成:10Hz、50Hz和100Hz。这个信号可能来自于物理测量,比如振动监测中的传感器数据。

原始信号

在这里插入图片描述

应用VMD

如果我们使用VMD算法来分解这个信号,理论上,它应该能够识别出三个独立的模态函数,每个模态函数对应一个原始信号中的频率成分。

分解结果

  • 模态1:大约10Hz的正弦波
  • 模态2:大约50Hz的正弦波
  • 模态3:大约100Hz的正弦波

这样的分解可以帮助我们更好地理解信号的结构,例如在故障诊断中识别不同的振动模式,或者在生物医学信号处理中分离心跳和呼吸信号。

VMD与EMD比较

VMD与经验模态分解(Empirical Mode Decomposition,EMD)类似,但VMD在分解过程中考虑了模态函数的中心频率,因此在处理非线性、非平稳信号时更为稳定和精确。EMD可能会产生模态混合的问题,而VMD通过优化过程尽量避免了这一点。

优化方法

VMD使用交替方向乘子法(Alternating Direction Method of Multipliers, ADMM)来求解上述优化问题。ADMM是一种高效的优化算法,特别适用于解决大规模凸优化问题。在VMD的上下文中,ADMM允许将复杂的优化问题分解为一系列更容易处理的子问题,通过迭代更新模态函数和中心频率来逼近全局最优解。

更新规则
在每次迭代中,ADMM算法执行以下步骤:
在这里插入图片描述

这个过程会一直持续到收敛,即模态函数和中心频率的变化小于某个预定阈值。

总结

VMD通过求解一个精心设计的变分问题,有效地将信号分解为一组具有清晰中心频率的模态,这些模态在频域上是相对独立的。这种方法在处理非线性、非平稳信号时尤其有用,因为它能够提供更准确的频谱信息和更稳定的分解结果。

2024/1/1 123.75 141.44978233067818 2024/1/7 168.571428571429 164.58807061400717 2024/1/7 168.571428571429 88.90894227150248 2024/1/14 205 149.4715770893992 2024/1/16 52.5 136.41907987248615 2024/1/17 38.75 48.555230155374 2024/1/28 88.75 98.74711815669839 2024/2/2 32.857142857142904 50.54266038039505 2024/2/2 32.857142857142904 51.77056225639738 2024/2/5 82.5 97.3466728624111 2024/2/6 95 77.28656265637308 2024/2/7 110 82.90365797321212 2024/2/8 120 107.29023222927522 2024/2/10 151.428571428571 112.40124095463952 2024/2/11 116.25 121.88067651092562 2024/2/18 47.99999999999999 56.003677776515694 2024/2/19 67.5 55.847826096774526 2024/2/20 26.5 74.12894162493086 2024/2/22 47.1428571428572 50.037483558704345 2024/2/23 57.5 58.72629260822178 2024/2/23 57.5 59.90278324034665 2024/2/25 85 71.33576752872008 2024/2/28 122.5 108.9989900963616 2024/3/11 85 84.32848045698128 2024/3/16 100 75.57018610879334 2024/3/22 65 64.63852076852191 2024/3/24 36 62.39492082209007 2024/3/25 41 45.1101102285979 2024/3/28 56.6666666666667 66.59210042370242 2024/3/31 87.5 85.55500914218962 2024/4/1 54.16666666666671 51.4276556700062 2024/4/3 75 36.78731342930887 2024/4/3 75 73.76915442987828 2024/4/6 49.49999999999999 57.76058767045256 2024/4/7 56.25 59.90187152601827 2024/4/10 50.83333333333331 57.4928560934163 2024/4/11 63.75 51.59536811040737 2024/4/14 66.6666666666667 74.62430391378464 2024/4/16 44 49.86779586148121 2024/4/21 91.6666666666667 80.99920808671243 2024/4/25 94 95.1916784497183 2024/4/25 94 101.6468276165237 2024/4/26 123.636363636364 101.54226255724868 2024/5/1 47.1428571428572 58.50932702270208 2024/5/2 68.3333333333333 64.01621832767732 2024/5/4 40.5 53.42829426027681 2024/5/11 63 79.31938023373458 2024/5/13 123.636363636364 109.90295137443077 2024/5/14 121.818181818182 103.38721464003619 2024/5/22 50.83333333333331 55.79412608640662 2024/5/23 77.5 80.42939479500879 2024/5/27 73.3333333333333 71.32283060586244 2024/6/3 96.6666666666667 88.01209786222385 2024/6/9 68.3333333333333 108.56864781513396 2024/6/11 83.3333333333333 48.55482492203493 2024/6/13 110 88.15962441453412 2024/6/14 122.727272727273 107.61549578817458 2024/6/27 46.50000000000001 44.078713021115306 2024/6/29 33 26.44193350991658 2024/7/1 42 52.59867325205077 2024/7/3 44.5 89.82048738852457 2024/7/4 39 52.19653144726541 2024/7/5 47.99999999999999 48.08958368353323 2024/7/9 49 57.59646598524163 2024/7/9 49 53.60283014788386 2024/7/11 63.3333333333333 66.97868019503072 2024/7/17 53.3333333333333 63.34636274774507 2024/7/19 41.5 42.89947272348277 2024/7/21 64.1666666666667 66.09878524599225 2024/7/22 66.6666666666667 65.00890057786901 2024/7/26 45.00000000000001 71.21665897622492 2024/7/28 40.5 44.13470403198099 2024/8/1 44.5 47.583181504691126 2024/8/2 45.00000000000001 47.583181504691126 2024/8/2 45.00000000000001 46.9087841595428 2024/8/3 51.6666666666667 45.23014594969053 2024/8/4 55.8333333333333 58.65054857410897 2024/8/6 68.3333333333333 54.60578952020746 2024/8/9 62.5 65.85809400034259 2024/8/10 75.8333333333333 71.9206795742283 2024/8/11 94.1666666666667 70.96740036589514 2024/8/15 90 80.34604289750527 2024/8/18 90 94.47656346062271 2024/8/22 81.6666666666667 86.53461449155253 2024/8/22 81.6666666666667 108.27781523932805 2024/8/23 65.8333333333333 82.53817106629121 2024/9/3 88.3333333333333 113.16247944014161 2024/9/3 88.3333333333333 88.23748357200765 2024/9/8 108.181818181818 101.89782847813537 2024/9/9 115.454545454545 96.45857559537323 2024/9/13 44 50.29448003948117 2024/9/18 80 83.8067648044246 2024/9/28 75 72.56515720406895 2024/9/29 100 70.64652960614046 2024/10/2 74.1666666666667 60.570719215034764 2024/10/5 102.727272727273 93.99401752385478 2024/10/11 130.909090909091 91.43861631520019 2024/10/11 130.909090909091 107.36748520058795 2024/10/13 63.75 70.11378396004059 2024/10/15 86.6666666666667 85.31855469197326 2024/10/16 71.6666666666667 67.85859636969488 2024/10/17 35.5 40.568489434724526 2024/10/22 37.5 41.13715300481026 2024/10/24 75.8333333333333 75.07703363794025 2024/10/26 56.6666666666667 59.31423576916348 2024/10/27 67.5 77.72187997314686 2024/10/30 78.3333333333333 74.72658701406004 2024/11/1 71.6666666666667 74.32719194724612 2024/11/1 71.6666666666667 78.99471579045824 2024/11/3 107.5 96.12724021398316 2024/11/5 55 88.70741079334934 2024/11/5 55 63.17230961245132 2024/11/7 70.8333333333333 69.40951088280127 2024/11/8 52.5 70.58982172647461 2024/11/9 50.5 65.39850926077335 2024/11/11 61.6666666666667 67.08648185133565 2024/11/13 66.6666666666667 67.06290561067581 2024/11/14 69.1666666666667 74.92724767621056 2024/11/16 62.5 67.72309837940713 2024/11/20 31.25 39.791267230677306 2024/11/21 56.25 53.09328772113596 2024/11/21 56.25 45.96954038585586 2024/11/22 67.5 55.89475640940251 2024/11/22 67.5 72.07171621764438 2024/11/29 60 63.75168781309595 2024/12/3 121.25 123.51751061089429 2024/12/3 121.25 85.35092998366582 2024/12/4 78.75 118.96571575050625 2024/12/5 48.5714285714286 77.23522342869911 2024/12/5 48.5714285714286 56.760071551348034 2024/12/6 50.00000000000001 55.67542260586588 2024/12/9 63.75 77.29555462085865 2024/12/11 90 91.88546031226497 2024/12/11 90 87.43060672017323 2024/12/12 105 89.23105190131274 2024/12/12 105 83.14521582557892 2024/12/28 44 51.14349839579385 2024/12/29 73.75 70.82581380052193 2024/12/31 145 113.7323729139217 2025/1/2 174.285714285714 158.40406690058774 2025/1/3 204 168.67990876026008 2025/1/4 157.142857142857 131.7945723625761 2025/1/5 75 92.88837622077833 2025/1/6 77.5 90.9308700022185 2025/1/10 44.28571428571429 53.946620996090516 2025/1/10 44.28571428571429 49.57827863490396 2025/1/11 78.75 78.29644384995049 2025/1/12 81.25 73.87610905688891 2025/1/13 106.25 80.38639509127034 2025/1/20 151.428571428571 136.6081186621433 2025/1/21 133.75 129.94744729140956 2025/1/22 135 130.24655227366316 2025/1/24 91.25 146.3767752344893 2025/1/27 55 71.46727057951108 2025/1/28 62.5 66.31463541778702 2025/2/1 67.5 71.37098161035166 2025/2/2 58.75 66.17426845 2025/2/5 58.75 88.75667212785046 2025/2/8 39 77.88252871091174 2025/2/9 45.7142857142857 52.18881850959389 2025/2/15 86.25 82.4133355641056 2025/2/16 82.5 80.27288373068554 2025/2/19 63.75 77.16937696990621 2025/2/23 116.25 86.76096912509652 2025/2/24 120 100.18931943988112 2025/2/28 76.25 62.27437528664383 2025/3/3 28 49.49588667705353 2025/3/4 42.857142857142904 31.204205454247344 2025/3/5 48.5714285714286 57.89927257633713 2025/3/6 72.5 63.413358717767835 2025/3/7 80 78.92374488524504 2025/3/9 80 74.84065901246376 2025/3/9 80 86.94889436125919 2025/3/11 65 68.96484811264284 2025/3/15 42.5 47.68307768671133 2025/3/17 54.16666666666671 54.844184083948534 2025/3/19 70 71.32317723530358 2025/3/21 75.8333333333333 76.9746305766928 2025/3/24 70 74.65521786082064 2025/3/29 70 77.40180710328875 2025/4/1 71 80.57870505575087 2025/4/2 81.6666666666667 81.99531424941331 2025/4/5 84.1666666666667 78.8368811413689 2025/4/6 97.5 94.72271732958869 2025/4/7 84.1666666666667 89.88488096255729 2025/4/14 98 95.67823824552184 2025/4/21 42 111.53290689851633 2025/4/23 81.6666666666667 57.141737161191365 2025/4/24 61.5 83.99447487776038 2025/4/26 91.6666666666667 84.24149848760464 2025/4/27 58.3333333333333 62.870282372247104 2025/4/28 95 59.83136943842301 2025/4/30 68.3333333333333 73.1449341049362 2025/5/1 80.8333333333333 82.50448713333525 2025/5/2 86.6666666666667 83.55990976104009 2025/5/3 80.8333333333333 87.13972460673028 2025/5/4 103.636363636364 98.5090122230891 2025/5/7 135.5 94.65732498676186 2025/5/7 135.5 118.08517354632647 2025/5/10 50.00000000000001 56.534837994279506 2025/5/15 50.83333333333331 55.91271636914875 2025/5/19 80 80.8946332197781 2025/5/21 55.8333333333333 57.6135692788171 2025/5/22 38.5 42.75042106739687 2025/5/22 38.5 63.47590727436925 2025/5/24 80.8333333333333 73.64128586482872 2025/5/25 123.636363636364 79.50115966335561 2025/5/27 97.5 106.27753198307643 2025/5/28 64.1666666666667 69.30680223618985 2025/5/31 33.5 70.81933813357111 2025/5/31 33.5 34.34381152519421 2025/6/1 43 38.11541438169796 2025/6/11 65.8333333333333 40.703264716877996 2025/6/14 44.5 71.8059471813712 2025/6/15 67.5 47.3519258804609 2025/6/16 80.8333333333333 76.75751861199961 2025/6/18 40.5 56.99724051629258 2025/6/21 52.5 50.91048391171709 2025/6/24 67.5 70.32261502977192 2025/6/25 85.8333333333333 83.64395823861886 2025/6/26 47.99999999999999 47.11187595527804 2025/6/26 47.99999999999999 82.26586779001731 2025/6/27 27.5 32.61973525719978 2025/6/29 33 38.471384454153934 2025/7/2 40.5 41.8137903149492 2025/7/3 41.5 41.55174601833187 2025/7/4 62.5 42.555910187138494 2025/7/6 89.1666666666667 67.94355289605272 2025/7/10 47.99999999999999 50.420961530730615 2025/7/12 38.5 53.933623933134314 2025/7/13 61.6666666666667 68.87604276458451 2025/7/14 57.5 75.07816532 2025/7/15 63.3333333333333 61.27539132564982 2025/7/16 61.6666666666667 61.2199272323314 2025/7/18 89.1666666666667 85.1940043760954 2025/7/19 109.090909090909 85.80104582479294 2025/7/21 44.5 51.048631974115125 2025/7/23 47 68.68200192813825 2025/7/24 70.8333333333333 72.70514810854169 2025/7/24 70.8333333333333 66.72884559566981 2025/7/28 41.5 44.24787044978878 2025/7/31 68.3333333333333 68.10199967482542 2025/8/1 58.3333333333333 57.21891596330586 2025/8/2 66.6666666666667 73.0065068273534 2025/8/2 66.6666666666667 59.566026288096104 2025/8/3 85 83.71691559565357 2025/8/3 85 79.21006390845372 2025/8/8 47.99999999999999 60.629516790631705 2025/8/17 67.5 46.08474692761816 2025/8/18 55 71.73300540615286 2025/8/21 43.5 42.74603613157312 2025/8/26 95 96.662891741162 2025/8/27 80 96.21714056534087 2025/8/28 85 72.027393057495 2025/9/1 60 47.6061644310276 2025/9/3 74.1666666666667 68.11991657351632 2025/9/4 68.3333333333333 70.02119887103083 2025/9/5 73.3333333333333 70.02119887103083 2025/9/5 73.3333333333333 70.89262161791024 2025/9/21 32 35.474220745225495 2025/9/23 29.5 47.931426661999886 2025/9/25 25.5 33.93622542134888 2025/9/25 25.5 36.402784316544256 2025/9/29 32.5 37.61827081824134 列名依次为时间、真实值、预测值,对以上预测结果进行分析
最新发布
11-26
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值