图像与机器人技术:从水墨风格到智能平台的探索
1. 图像风格转换研究
1.1 图像风格损失与特征提取
在图像风格转换的研究中,涉及到一些重要的概念和方法。其中,$L_{l}^{style}$ 表示风格层中第 $l$ 层的风格损失,$L_{style}$ 是总风格损失,它通过计算各风格层损失的加权和得到。$D$ 是一种分布距离度量,这里使用的是 Wasserstein 距离。
为了解决传统图像风格化方法特征提取能力不足的问题,采用 Resnet 158 作为特征提取器。使用卷积神经网络的标准化层、conv1 层,以及残差网络的 layer1、layer2、layer3 和 layer4 的特征来表征风格;用卷积神经网络的标准化层、conv1 层,以及残差网络的 layer1、layer2、layer3 来描述内容。
为了使用 Wasserstein 距离计算风格损失,在相应层附加了判别器网络。这些判别器在 Wasserstein - gp 下近似风格特征和生成特征之间的 Wasserstein 距离。每个判别器有 3 个隐藏层,维度为 256,并使用 ReLU 激活函数。在将特征输入判别器之前,先通过单位级 Tanh 激活函数输入,这有助于训练损失的正则化和有界性。
1.2 实验结果与分析
实验采用了特定的风格 - 内容组合。在实验中,根据图像的一维熵调整风格权重。对于一维熵较低的风格图像,增加其风格权重,以增强网络对风格的敏感性。因为风格图像的一维熵越大,图像包含的信息量就越大,风格特征也就越明显。所以,根据图像一维熵调整风格权重是完全合理的,并且大大降低了网络参数调整的难度。
由于写意水墨画
超级会员免费看
订阅专栏 解锁全文
351

被折叠的 条评论
为什么被折叠?



