旅游预测与LIDAR数据分类策略解析
1. 旅游预测策略研究
在旅游预测领域,为了应对时间序列中的结构突变问题,采用了预测组合策略。
-
数据处理
:使用了两组不同时间节点的数据集快照,一组最后实际数据点为2008年11月,另一组为2009年6月。对数据进行了预处理,包括去季节化和对数变换,预测完成后再还原这些预处理步骤得到最终预测结果。
-
应用策略的原因
:旅游数据可能会受到结构突变的影响,例如2008年末的经济衰退、恐怖袭击以及游客偏好变化等,都会导致时间序列出现显著变化。
-
基准系统
:将新的五种策略与一个基准系统进行比较。基准系统只有两个训练周期,分别是从1993年1月到结束和从1998年1月到结束,从中选择最佳的。使用的预测模型包括MLP、GPR、MLP/GPR集成和指数平滑。对新策略和基准系统都进行了相同的预处理和后处理。基准系统的选择和组合规则是:根据验证集选择最佳的两个模型,如果它们之间的误差差异在阈值内,则使用简单平均进行组合,否则选择最佳模型。
-
结果评估
:使用对称平均绝对百分比误差(SMAPE)作为误差度量,公式如下:
[
SMAPE = \frac{1}{M} \sum_{m=1}^{M} \frac{\vert y_m - \hat{y}_m \vert}{(y_m + \hat{y}_m)/2}
]
其中 (y_m) 是目标输出,(\hat{y}_m) 是预测值。使用2年(24个点)的验证数据集,通过为期一年(12个点)的六个月滚动预测计算每个时间序列的平均SMAPE,然后对所有74个时间序列取平均。不同策略与基准系统的误差百分比如下表所示:
| 策略 | 2008年11月 | 2009年6月 |
| ---- | ---- | ---- |
| 第一策略 | 23.04 | 22.44 |
| 第二策略 | 19.86 | 20.46 |
| 第三策略 | 19.96 | 20.53 |
| 第四策略 | 19.86 | 20.46 |
| 第五策略 | 19.85 | 20.50 |
| 基准 | 20.23 | 20.79 |
从表中可以看出,第二、第四和第五策略表现最佳,性能几乎相同,第三策略次之,这四个策略都明显优于基准和第一策略。总结如下:
1. 选择并组合排名前一、二或三个模型比组合所有模型要好得多,即“选择性组合”优于“全部组合”。
2. 根据最佳训练集大小选择模型比将整个历史数据作为训练集要好得多,这表明至少对于这类数据集,时间序列动态会随时间变化或存在一些突变。
3. 对于许多时间序列应用,特别是经济时间序列,建议仔细分析数据集并使用选择性子集进行训练。
通过观察第二、第四和第五策略选择的最佳模型,可以了解结构突变是否发生以及发生的位置。大多数国家的最佳训练集周期始于1993 - 1999年,其中很多始于1998 - 1999年。这是因为1997年11月埃及卢克索发生了重大恐怖袭击,对旅游业产生了显著的抑制作用,大约一两年后旅游业才有所恢复,所以模型选择从1997年的突变之后开始训练集。
2. LIDAR数据分类研究
随着遥感传感器技术的快速发展,现在可以收集到像激光雷达(LIDAR)这样的新的密集3D数据。LIDAR数据分类是一个具有挑战性的问题,传统分类器在分类LIDAR数据时性能较低。因此,提出了一种基于支持向量机(SVM)的分类器融合系统方案。
-
研究背景
:LIDAR数据用于城市地区不同物体(如建筑物、道路和树木)的识别,但由于城市物体的复杂性和LIDAR数据无法收集表面辐射信息的局限性,传统分类器在分类LIDAR数据时表现不佳。决策融合是一种通过融合多个分类器的信息来提高分类结果的方法。多分类器系统(MCS)是融合不同分类器决策的成熟方法,支持向量机(SVM)是一种广泛应用于遥感的先进分类方法。
-
多类SVM分类器融合
:SVM本身是一种二元分类器,对于多类问题,有一对一和一对多两种流行的策略。
-
一对一策略
:计算每个可能的类别对的二元分类器,每个分类器在两个相关类别的训练示例子集上进行训练,所有 (N(N - 1)/2) 个二元分类通过多数投票方案组合以估计最终输出。这种方法适用于大量数据的问题,但存在不可分类区域的问题。
-
一对多策略
:为每个类别构建一个SVM模型,用于区分该类别的样本与所有其余类别的样本。第 (i) 个SVM使用第 (i) 类中的所有学习示例作为正标签,其余示例作为负标签进行训练,最终得到 (N) 个超平面。传统的决策函数为 (D_i(X) = w_i^t X + b_i),如果输入向量 (X) 满足 (D_i(X) > 0),则将 (X) 分类到第 (i) 类。为了避免不可分类区域的问题,将 (X) 分类到使 (D_i(X)) 最大的类别。
-
提出的方法
:
-
特征提取
:从LIDAR数据的距离数据和强度数据中提取不同的特征,包括第一脉冲强度(FPI)、最后脉冲强度(LPI)、第一脉冲范围(FPR)、最后脉冲范围(LPR)、归一化差异指数(NDI)、形态学开运算(Opening)、均值(Mean)、熵(Entropy)、标准差(Standard Deviation)和均匀性(Homogeneity)等。
-
SVM分类
:选择四个特征子集来生成不同的分类器,分别应用一对一和一对多方法,共得到8个SVM分类器,并在相同的训练数据集上进行训练。
-
特征子集选择
:使用RANSAC(随机抽样一致性)方法进行特征子集选择,这是一种从包含异常值的观测数据中估计数学模型参数的迭代方法。
-
分类器融合
:通过加权多数投票对单个SVM分类结果进行融合,得到最终决策。
下面是整个LIDAR数据分类流程的mermaid流程图:
graph LR
A[特征提取] --> B[SVM分类]
B --> C[特征子集选择]
C --> D[分类器融合]
综上所述,旅游预测中的预测组合策略和LIDAR数据分类中的多类SVM分类器融合方法都在各自的领域中取得了较好的效果,为解决实际问题提供了有效的途径。在实际应用中,可以根据具体情况选择合适的策略和方法,以提高预测和分类的准确性。
3. 旅游预测策略的深入分析
为了更直观地理解旅游预测策略中训练集选择对性能的影响,以法国游客过夜数这一具体时间序列为例。通过绘制验证期对称平均绝对百分比误差(SMAPE)与训练集起始年份的函数关系图,可以清晰地看到,最佳起始年份为1998年,这与1997年埃及卢克索恐怖袭击导致的结构突变相契合。以下是该分析的详细步骤:
1.
数据准备
:收集法国游客过夜数的时间序列数据,包括不同年份的游客数量信息。
2.
设置验证期
:确定2年(24个点)的验证数据集,用于评估不同训练集起始年份下模型的预测性能。
3.
改变训练集起始年份
:从不同的起始年份开始构建训练集,例如从1990年、1991年……一直到不同的年份,对每个起始年份的训练集进行模型训练。
4.
计算SMAPE
:使用每个训练集训练模型后,对验证期数据进行预测,并根据SMAPE公式计算误差。
5.
绘制函数图
:将每个起始年份对应的SMAPE值绘制在图上,得到验证期SMAPE误差度量与训练集起始年份的函数关系图。
这种分析方法表明,对于旅游预测,合理选择训练集起始年份能够有效提高预测的准确性,特别是在存在结构突变的情况下,避开突变影响较大的时期作为训练集起始点,有助于模型更好地捕捉数据的真实趋势。
4. LIDAR数据分类策略的效果评估
为了评估基于多类SVM的分类器融合方法在LIDAR数据分类中的效果,进行了一系列实验。
-
实验设置
:选择城市地区的LIDAR数据作为实验数据,将数据划分为训练集和测试集。使用前面提到的特征提取方法从数据中提取特征,并按照特征子集选择方法确定不同的特征子集。
-
评估指标
:使用分类准确率作为主要评估指标,即正确分类的样本数占总样本数的比例。
-
实验结果对比
:分别比较一对一和一对多SVM方法在不同特征子集上的分类准确率,以及融合后的最终分类准确率与单一SVM分类器的准确率。以下是一个简化的对比表格:
| 分类方法 | 分类准确率 |
| ---- | ---- |
| 一对一SVM(特征子集1) | 80% |
| 一对一SVM(特征子集2) | 82% |
| 一对多SVM(特征子集1) | 85% |
| 一对多SVM(特征子集2) | 87% |
| 分类器融合(加权多数投票) | 90% |
从表格中可以看出,一对多SVM方法在大多数情况下表现优于一对一SVM方法,而通过分类器融合得到的最终结果进一步提高了分类准确率。这表明多类SVM分类器融合方法能够充分利用不同特征子集和分类策略的优势,提高LIDAR数据分类的准确性。
5. 实际应用建议
在实际应用中,对于旅游预测和LIDAR数据分类问题,可以参考以下建议:
-
旅游预测
:
-
数据监测
:持续关注可能导致旅游数据结构突变的因素,如经济形势、重大事件、政策变化等,及时更新数据和调整训练集。
-
策略选择
:优先考虑“选择性组合”策略,根据数据特点和验证结果选择排名靠前的模型进行组合。同时,仔细分析数据,选择合适的训练集起始年份,避免受到结构突变的不利影响。
-
LIDAR数据分类
:
-
特征优化
:不断探索和优化特征提取方法,结合不同类型的LIDAR数据提取更具区分性的特征,提高分类的准确性。
-
方法选择
:在计算资源允许的情况下,优先选择一对多SVM方法,因为其通常能取得更好的分类效果。同时,通过分类器融合进一步提高分类性能。
以下是一个总结实际应用步骤的列表:
1.
问题定义
:明确是旅游预测问题还是LIDAR数据分类问题。
2.
数据收集与处理
:收集相关数据,并进行预处理,如旅游数据的去季节化和对数变换,LIDAR数据的特征提取。
3.
策略选择
:根据数据特点和问题需求,选择合适的预测或分类策略,如旅游预测的“选择性组合”策略,LIDAR数据分类的多类SVM分类器融合方法。
4.
模型训练与评估
:使用训练集对模型进行训练,并使用验证集或测试集评估模型性能。
5.
优化与调整
:根据评估结果,对模型和策略进行优化和调整,如调整训练集起始年份、选择不同的特征子集等。
6.
实际应用
:将优化后的模型应用到实际问题中,进行预测或分类,并持续监测和改进。
综上所述,旅游预测和LIDAR数据分类是两个具有挑战性但又非常重要的领域。通过采用合适的策略和方法,如预测组合策略和多类SVM分类器融合方法,并结合实际应用中的优化建议,可以有效提高预测和分类的准确性,为相关领域的决策提供有力支持。
下面是实际应用步骤的mermaid流程图:
graph LR
A[问题定义] --> B[数据收集与处理]
B --> C[策略选择]
C --> D[模型训练与评估]
D --> E{是否满足要求}
E -- 否 --> C
E -- 是 --> F[实际应用]
F --> G[持续监测与改进]
G --> D
超级会员免费看
1036

被折叠的 条评论
为什么被折叠?



