多视图时空网络在车辆加油需求推断中的应用
1. 特征提取
在车辆加油需求推断的研究中,涉及多种特征的提取。
- POI 特征 :考虑 13 种 POI 类别,包括餐厅、医院、观光景点、公园、游乐场、超市、图书馆、学校、公司、公交站、地铁站、居民区和酒店。将每个区域内各类 POI 的数量作为一个特征,用 (X_p = {x_p^c}_{c\in C_p}) 表示为位置 (l) 提取的 POI 特征。
- 加油站自身特征 :对于每个加油站 (s),从其影响区域(半径 2 公里)内的数据中提取气象特征 (X_m^s)、道路网络特征 (X_r^s) 和 POI 特征 (X_p^s)。同时,还考虑两个与自身相关的特征:
- (X_d^s):记录加油站 (s) 到其他加油站(目标位置)的距离和方向。
- (X_v^s):包含加油站 (s) 在时间段 (t) 内观测到的加油量值序列。
2. 多视图时空网络架构
提出的多视图时空网络由空间视图和时间视图组成。
- 空间视图 :对于与空间相邻区域相关的非序列特征 (X_r^s \cup X_p^s \cup X_d^s),使用全连接(FC)层的单独堆栈(基本 FC 层)来学习每个特征组的高阶交互。公式如下:
[
z_m^ =
\begin{cases}
\varphi(W^{(m) } \cdot (X_p^ \oplus X_r^ \oplus X_d^ ) + b^{(m) }), & m = 1 \
\varphi(W^{(m) } \cdot z_{m - 1}^ + b^{(m) }), & 1 \leq m \leq L
\end{cases}
]
其中,( ) 表示 (l)(局部特征)或 (s)(面向加油站的特征),(L) 是 FC 层的数量,(\varphi) 是激活函数,即 ReLU。
-
时间视图 :采用长短期记忆网络(LSTM)对序列特征 (X_m^s \cup X_v^s) 进行编码。LSTM 通过在时间间隔 (t) 内维护一个记忆单元 (c_t) 来稳定地学习序列相关性,记忆单元与输入门 (i)、遗忘门 (f) 和输出门 (o) 相关联,以控制序列信息的流动。具体公式如下:
[
\begin{align }
i_t &= \sigma(W_{ix} \cdot (X_{m,t} \oplus X_{v,t}) + W_{ih} \cdot h_{t - 1} + W_{ic} \odot c_{t - 1} + b_i) \
f_t &= \sigma(W_{fx} \cdot (X_{m,t} \oplus X_{v,t}) + W_{fh} \cdot h_{t - 1} + W_{fc} \odot c_{t - 1} + b_f) \
c_t &= f_t \odot c_{t - 1} + i_t \odot \tanh(W_{cx} \cdot (X_{m,t} \oplus X_{v,t}) + W_{ch} \cdot h_{t - 1} + b_c) \
o_t &= \sigma(W_{ox} \cdot (X_{m,t} \oplus X_{v,t}) + W_{oh} \cdot h_{t - 1} + W_{oc} \odot c_{t - 1} + b_o) \
h_t &= o_t \odot \tanh(c_t)
\end{align }
]
其中,(X_{m,t} \oplus X_{v,t}) 和 (h_t) 分别是时间 (t) 时的串联序列输入元素和相应的记忆单元输出激活向量,(W) 表示权重矩阵,(b) 表示偏置向量,(\odot) 表示 Hadamard 积,(\sigma) 表示 sigmoid 函数。 -
特征融合 :在基本 FC 层和 LSTM 层之上添加另一个 FC 层(融合 FC 层),以捕获序列和非序列特征之间的交互。公式如下:
[
z_n^ =
\begin{cases}
\varphi(W^{(n) } \cdot (z^{(L) } \oplus h_T^ ) + b^{(n) }), & n = L + 1 \
\varphi(W^{(n) } \cdot z_{n - 1}^ + b^{(n) }), & L + 2 \leq n \leq L + L’
\end{cases}
]
为了结合位置 (l) 的潜在特征和加油站集合 (S) 中平均的高级特征 ({z^{(L + L’)} s} {s\in S}),添加一个隐藏连接层来学习高阶交互:
[
z_f = \varphi(W_f \cdot (z^{(L + L’)} l \oplus {z^{(L + L’)}_s} {s\in S}) + b_f)
]
最后,将融合层的输出向量 (z_f) 转换为最终的推断分数:
[
\hat{y} = w_i^T \cdot z_f + b_i
]
其中,(w_i) 和 (b_i) 是权重向量和偏置标量参数。为了防止过拟合问题,采用 Dropout 和 L2 正则化用于损失函数:
[
L(h) = \sum_{i = 1}^{N} (y_{i,t + 1} - \hat{y}_{i,t + 1})^2 + \lambda |W|^2
]
3. 实验设置
- 数据集描述 :
- 车辆加油数据 :由 161 个加油站在 2019 年 1 月 25 日至 2019 年 3 月 26 日期间收集,流数据为实时数据,按 1 小时间隔进行分割。
- 气象数据 :从 meteo - manz.com 下载,包含小时级气象记录,采用天气、温度、压力和湿度作为气象特征。
- POI 数据和道路网络数据 :从百度地图 API 下载乌鲁木齐的 POI 和道路网络,获得 194,020 个 POI 和 32,873 个道路标记。
- 距离和方向数据 :选择位置 (l) 的影响区域大小为 2 公里×2 公里,记录该区域内每个加油站的距离和方向。
- 预处理和参数设置 :
- 输入值通过训练集上的 Min - Max 归一化方法归一化到 [0, 1]。
- 所有实验在具有四个 NVIDIA TESLA K80 GPU 的 Linux 服务器上运行。
- 基本 FC 层(空间视图内,(L = 1))每层的神经元数量设置为 100,时间视图内的 LSTM 设置为两层,每层 300 个记忆单元。融合 FC 层((L’ = 2))每层的神经元数量设置为 200。
- 评估指标 :使用平均绝对百分比误差(MAPE)和均方根误差(RMSE)来评估模型性能,公式如下:
[
\begin{align }
MAPE &= \frac{1}{N} \sum_{i = 1}^{N} \frac{|\hat{y} {i,t + 1} - y {i,t + 1}|}{y_{i,t + 1}} \
RMSE &= \sqrt{\frac{1}{N} \sum_{i = 1}^{N} (\hat{y} {i,t + 1} - y {i,t + 1})^2}
\end{align }
]
其中,(N) 是测试样本的总数,(\hat{y} {i,t + 1}) 和 (y {i,t + 1}) 分别表示时间间隔 (t + 1) 的推断值和真实值。 - 对比方法 :将提出的框架与以下两种方法进行比较:
- 长短期记忆网络(LSTM) :一种用于深度学习领域的人工循环神经网络架构,适用于基于时间序列数据进行分类、处理和预测。
- 双向 LSTM(Bi - LSTM) :沿正向和反向两个方向对序列进行建模,通常表现更好,因为它能捕获更丰富的数据表示。
4. 实验结果
| 方法 | MAPE | RMSE |
|---|---|---|
| LSTM | 76.32% | 0.1052 |
| Bi - LSTM | 75.49% | 0.1046 |
| 提出的网络 | 41.99% | 0.0963 |
从实验结果可以看出,提出的网络在 MAPE 和 RMSE 指标上均取得了最低值,相对于基线方法的最佳性能,MAPE 有 79.78% 的相对改进,RMSE 有 8.62% 的相对改进。同时,提出的网络在训练数据集和验证数据集上的损失曲线收敛速度比 LSTM 和 Bi - LSTM 更快,收敛率最快且 RMSE 最低。在七周的实验中,提出的网络在六周内显著优于其他两种方法。当去除外部特征(如 POI、道路网络和气象特征)时,网络会退化为 LSTM,这表明外部特征对车辆加油需求推断有积极影响。不过,在预测曲线方面,提出的方法与其他两种方法相比,并没有显著更好的结果,仍有改进空间。
mermaid 流程图如下:
graph LR
A[特征提取] --> B[多视图时空网络架构]
B --> C[空间视图]
B --> D[时间视图]
B --> E[特征融合]
C --> F[基本 FC 层]
D --> G[LSTM 层]
E --> H[融合 FC 层]
H --> I[隐藏连接层]
I --> J[最终推断分数]
A --> K[实验设置]
K --> L[数据集描述]
K --> M[预处理和参数设置]
K --> N[评估指标]
K --> O[对比方法]
J --> P[实验结果]
P --> Q[指标对比]
P --> R[收敛情况]
P --> S[外部特征影响]
综上所述,提出的多视图时空网络在车辆加油需求推断方面表现出较好的性能,但仍有进一步优化的空间。在未来的工作中,可以考虑将注意力机制集成到模型中进行进一步尝试。
多视图时空网络在车辆加油需求推断中的应用(续)
5. 技术细节分析
特征提取的重要性
特征提取是整个模型的基础,不同类型的特征为模型提供了丰富的信息。POI 特征反映了加油站周边的功能区域分布,例如餐厅、超市等 POI 的数量可能影响到该区域的人流量和车辆活动频率,进而影响加油需求。气象特征如天气、温度等会影响人们的出行意愿和车辆的使用情况,比如在寒冷天气下,车辆的能耗可能会增加,从而导致加油需求上升。道路网络特征可以体现该区域的交通便利性,交通繁忙的道路附近的加油站可能会有更多的加油需求。而加油站自身的距离和方向特征以及加油量序列特征,则从加油站自身的角度为模型提供了独特的信息,有助于模型更准确地推断每个加油站的加油需求。
空间视图与时间视图的协同作用
空间视图通过基本 FC 层对非序列特征进行处理,学习特征之间的高阶交互。这种处理方式能够捕捉到空间上相邻区域特征之间的复杂关系,例如加油站周边的道路网络和 POI 分布对加油需求的综合影响。时间视图采用 LSTM 对序列特征进行编码,能够处理具有长周期性的序列数据,如气象特征和加油量序列。LSTM 的记忆单元机制可以有效地解决传统 RNN 中梯度消失和爆炸的问题,从而更好地捕捉序列数据中的长期依赖关系。空间视图和时间视图的协同作用,使得模型能够同时考虑空间和时间维度上的信息,提高了模型的推断能力。
特征融合的意义
特征融合是将空间视图和时间视图的输出进行整合,通过融合 FC 层和隐藏连接层学习序列和非序列特征之间的交互。这种融合方式能够充分利用不同类型特征的优势,将空间和时间信息进行有机结合。例如,空间上的 POI 分布和时间上的气象变化可能共同影响加油需求,特征融合可以捕捉到这种复杂的交互关系,从而提高模型的准确性。
6. 操作步骤总结
数据准备
- 收集车辆加油数据,由 161 个加油站在 2019 年 1 月 25 日至 2019 年 3 月 26 日期间收集,按 1 小时间隔进行分割。
- 从 meteo - manz.com 下载气象数据,包含小时级气象记录,选择天气、温度、压力和湿度作为气象特征。
- 从百度地图 API 下载乌鲁木齐的 POI 和道路网络数据,获得 194,020 个 POI 和 32,873 个道路标记。
- 确定位置 (l) 的影响区域大小为 2 公里×2 公里,记录该区域内每个加油站的距离和方向数据。
数据预处理
- 使用 Min - Max 归一化方法将输入值在训练集上归一化到 [0, 1]。
模型构建
- 空间视图:设置基本 FC 层((L = 1)),每层神经元数量为 100,对非序列特征 (X_r^s \cup X_p^s \cup X_d^s) 进行处理。
- 时间视图:设置 LSTM 为两层,每层 300 个记忆单元,对序列特征 (X_m^s \cup X_v^s) 进行编码。
- 特征融合:设置融合 FC 层((L’ = 2)),每层神经元数量为 200,对空间视图和时间视图的输出进行融合。添加隐藏连接层结合位置 (l) 的潜在特征和加油站集合 (S) 中平均的高级特征。
模型训练与评估
- 在具有四个 NVIDIA TESLA K80 GPU 的 Linux 服务器上运行模型训练。
- 采用 Dropout 和 L2 正则化用于损失函数,防止过拟合。
- 使用平均绝对百分比误差(MAPE)和均方根误差(RMSE)评估模型性能,与 LSTM 和 Bi - LSTM 进行对比。
7. 未来展望
虽然提出的多视图时空网络在车辆加油需求推断方面取得了较好的效果,但仍有改进的空间。未来可以考虑以下几个方面的优化:
- 引入注意力机制 :注意力机制可以帮助模型更加关注重要的特征和时间步,从而提高模型的准确性和泛化能力。例如,在处理气象特征时,注意力机制可以自动分配不同气象因素的权重,更好地捕捉气象变化对加油需求的影响。
- 融合更多类型的数据 :除了现有的车辆加油数据、气象数据、POI 数据和道路网络数据外,可以考虑融合更多类型的数据,如交通流量数据、油价数据等,以提供更丰富的信息,进一步提高模型的推断能力。
- 模型优化与调参 :可以使用更先进的优化算法和调参策略,对模型的参数进行更精细的调整,以提高模型的性能。例如,使用自适应学习率算法,根据模型的训练情况动态调整学习率,加快模型的收敛速度。
mermaid 流程图如下:
graph LR
A[数据准备] --> B[数据预处理]
B --> C[模型构建]
C --> D[空间视图构建]
C --> E[时间视图构建]
C --> F[特征融合构建]
D --> G[基本 FC 层设置]
E --> H[LSTM 层设置]
F --> I[融合 FC 层设置]
I --> J[隐藏连接层设置]
C --> K[模型训练与评估]
K --> L[服务器运行训练]
K --> M[正则化处理]
K --> N[评估指标计算]
K --> O[对比实验]
N --> P[MAPE 计算]
N --> Q[RMSE 计算]
O --> R[与 LSTM 对比]
O --> S[与 Bi - LSTM 对比]
K --> T[未来优化方向]
T --> U[引入注意力机制]
T --> V[融合更多类型数据]
T --> W[模型优化与调参]
总之,多视图时空网络为车辆加油需求推断提供了一种有效的方法,通过不断的优化和改进,有望在实际应用中发挥更大的作用。
超级会员免费看

4635

被折叠的 条评论
为什么被折叠?



