DWTA - Unet:混凝土裂缝分割与PS - Net在遮挡行人重识别中的应用
1. 引言
在建筑和基础设施领域,由于结构老化、环境因素和自然灾害等原因,结构健康监测(SHM)至关重要。混凝土作为建筑中广泛使用的材料,其表面裂缝是常见的损伤形式。传统的人工裂缝检测效率低且结果主观,而传统计算机视觉方法如边缘检测、阈值法和光谱分析等,易受实际环境中模糊、阴影和划痕的影响。
随着深度学习的发展,卷积神经网络(CNNs)在图像识别、目标检测和语义分割等高级计算机视觉任务中得到广泛应用。一些基于全卷积神经网络(FCNN)的方法被用于混凝土裂缝分割,但FCNN在检测细裂缝和裂缝边界时存在不足,信息易在卷积和池化层中丢失。
同时,在行人重识别领域,遮挡问题一直是挑战。PS - Net模型通过实验证明了其在遮挡行人重识别中的有效性,优于单纯使用姿态信息辅助提取行人特征的方法,与最先进的方法相比也具有竞争力。
2. DWTA - Unet模型
2.1 网络架构
DWTA - Unet网络基于Unet网络构建,由Unet网络和DWTA模块两部分组成。Unet的编码器基于VGG16骨干网络。对输入图像进行四级离散小波变换(DWT),得到的特征图输入到DWTA模块,该模块的另一个输入是最大池化层得到的特征图。DWTA模块后接两到三个卷积层。
在解码器的每个阶段,先对高级特征图进行上采样,上采样层后接一个3 * 3卷积层,然后将上采样后的特征图与VGG16得到的相同分辨率的特征图拼接,拼接后的特征图输入到另一个3 * 3卷积层进行特征融合,这样融合的特征图既包含有助于获取裂缝边界信息的详细信息,又保留了有利于裂缝像
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



