基于复合深度神经网络的视频人体活动识别与移动边缘网络缓存算法研究
1. 视频人体活动识别实验
在视频人体活动识别的研究中,为了开展相关实验,采用了特定的数据集和实验设置。每种活动由 25 人完成,每人进行同一活动 4 - 7 次,视频帧分辨率为 320×240。为便于 ZFNet 单帧网络和 LRCN 的训练和测试,将 UCF101 数据集分为训练集和测试集,训练集包含 9537 个视频样本,测试集包含 3783 个视频样本。接着对视频样本进行预处理,得到 RGB 图像帧和光流图像帧,分别训练 RGB 单帧网络和光流单帧网络,以及在 RGB 图像帧和光流图像帧上训练 LRCN,得到相应的网络模型。
实验进行了三种比较:
- 单帧网络与 LRCN 用于数据流学习网络的比较 :分别测试静态数据流学习网络(SDSLN)和动态数据流学习网络(DDSLN)的性能,动态数据流学习网络的性能受光流图像生成方法影响。还将文献[14]中的双流深度神经网络与提出的复合深度神经网络进行比较,在数据流学习网络中分别使用单帧网络和 LRCN。相关分类性能比较如下表所示:
| 输入 | 模型 | SDSLN | DDSLN | DDSLN - H | (1/2) SDSLN + (1/2) DDSLN - H | (1/2) SDSLN + (1/2) DDSLN – F |
| — | — | — | — | — | — | — |
| 准确率(%) | 单帧网络 | 67.32 | 74.26 | 76.47 | 75.25 | 78.10 |
| 准确率(%) | LRCN | 68.33 | 77.23 | 80.2 | 80.20 | 8
超级会员免费看
订阅专栏 解锁全文

807

被折叠的 条评论
为什么被折叠?



