视觉城市感知与自动缩略图生成技术解析
视觉城市感知
在视觉城市感知领域,为了评估所提出网络的有效性,研究人员提出了两种网络结构:PRN和SAPN,并将SAPN模型与几种最先进的视觉城市感知预测方法进行了比较。
网络结构介绍
- PRN (ResNet) :以图像对作为输入,由两个具有预训练绑定权重的ResNet - 50网络组成。将最后一层有1000个神经元的层改为有一个神经元的全连接层,并且卷积层中的所有权重都固定。它试图找到一个映射函数来为每个图像预测一个分数,并使用铰链损失将两个分数结合起来。
- PRN (fine - tuned) :结构与PRN (ResNet)相同,但对ResNet - 50的块4和块5进行了微调。
- SAPN (ResNet) :结合图像的通用特征和语义信息来预测一个感知属性的分数,并且感知流中网络的权重固定为预训练权重。
- SS - CNN :以图像对作为输入,由两组不相交的相同层组成,用于特征提取,具有绑定权重,后面跟着一个使用softmax损失的融合子网络来训练网络。
- RSS - CNN :是SS - CNN的改进版本,通过添加一个由全连接绑定权重层组成的排名子网络来修改SS - CNN,并结合softmax损失和排名损失来训练网络。
实验结果
在PP 2.0数据集上进行实验,将每个属性的三元组集按6