人群分割--Fully Convolutional Neural Networks for Crowd Segmentation

最新推荐文章于 2021-10-18 00:54:26 发布

原创最新推荐文章于 2021-10-18 00:54:26 发布 · 2.2k 阅读

2 ·

CC 4.0 BY-SA版权

人群分析同时被 2 个专栏收录

38 篇文章

订阅专栏

人群分析

37 篇文章

订阅专栏

本文介绍了一种基于全卷积神经网络（FCNN）的人群分割方法，该方法能够处理视频中的静态人群，并利用外观、运动和结构信息提高分割准确性。面对人群纹理与背景相似的挑战时，运动信息成为关键。文章还详细介绍了三种融合方案，包括输入融合、特征融合和决策融合。

Fully Convolutional Neural Networks for Crowd Segmentation
https://arxiv.org/abs/1411.4464

这里设计了一个全卷积网络用于视频中的人群分割，主要考虑三个信息：Apperance、 Motion 、Structure，思路还是很原始的。
主要的难度在于静态的人群我们也想分割出来，再就是当人群的纹理和背景相似的时候，这个时候就需要靠运动信息了。

这里写图片描述

CNN and FCNN models
这里写图片描述

Multi-stage fusion structure
这里写图片描述
三个网络结构一样的：The our proposed FCNN can be represented as: Conv(32,7,1) - ReLU - Pool(MAX,2,2) -Conv(64,7,1) - ReLU - Pool(MAX,2,2) - Conv(128,3,1) -ReLU - Conv(128,3,1) - ReLU - Conv(64,3,1) - ReLU -Conv(16,3,1) - ReLU - Conv(1,1,1) - Sig.

Fusion Schemes and Extensible Architecture
input fusion, feature fusion, and decision fusion.

1） The input fusion directly concatenate input maps as multiple channels.
2） The feature fusion combines output feature maps of a certain fusion layer and use feature maps of all three networks to make a decision.
3）The decision fusion scheme combines the output maps of three separately trained networks.

训练数据标记
这里写图片描述