基于生成对抗网络的交通视频补全模型
一、引言
在计算机视觉领域,视频作为研究基础正受到越来越多的关注。特别是近年来,随着自动驾驶领域的快速发展,交通视频的重要性日益凸显。完整的视频对于问题处理的及时性和准确性至关重要,但在现实生活中,视频丢失的情况经常发生,因此补充缺失的交通视频十分必要。
目前,交通补全研究大多集中在一些数值数据上。在补充交通流量的过程中,常使用传统的高阶平滑指数模型和GBRT模型进行建模。随着深度学习的快速发展,也出现了一些基于深度学习的交通状态补全方法。然而,这些模型只能处理低维数值数据。一方面,视频作为高维数据,难以获取语义信息,补全过程对硬件设施要求较高,常需具有并行GPU的计算机进行处理;另一方面,由于高维数据的稀疏表示,很难通过传统统计模型和先验知识对视频进行建模。
基于此,提出了一种基于生成对抗网络(GAN)的补全模型,以填补高维交通数据补全研究的空白。通过将未标记的视频序列输入到生成器中,使用特征金字塔网络(FPN)提取视频帧的多尺度特征,经过对抗训练直接生成缺失的视频帧。同时引入对抗损失和内容损失,有效提高了生成视频帧的质量。
二、相关工作
2.1 生成对抗网络
GAN包括生成器模型和判别器模型。生成器模型接受原始噪声或随机向量并输出生成样本,判别器分别接收生成样本和真实样本,判断它们之间的差异,并将结果反馈给生成器,指导生成器生成更逼真的样本。在不断的对抗学习中,它们最终会达到平衡。其目标函数如下:
[
\min_{G} \max_{D} V(D, G) = \frac{1}{m} \sum_{i=1}^{m} \log D(x_i) + \frac{1}
超级会员免费看
订阅专栏 解锁全文
7723

被折叠的 条评论
为什么被折叠?



