生成式深度学习:从DeepDream到图像生成技术探索
1. DeepDream与快速探索
在生成式深度学习中,通过随机生成 layer_contributions 字典中的参数,可以快速探索许多不同的层组合。以一张美味的自制糕点图像为例,使用不同的层配置可以得到一系列不同的结果。
DeepDream本质上是将卷积神经网络逆向运行,基于网络学习到的表示来生成输入。其生成的结果有趣,且与人类视觉皮层受迷幻剂干扰时产生的视觉假象有些相似。值得注意的是,这个过程并不局限于图像模型甚至卷积网络,它同样适用于语音、音乐等领域。
2. 神经风格迁移概述
除了DeepDream,深度学习驱动的图像修改的另一个重大发展是神经风格迁移。神经风格迁移由Leon Gatys等人在2015年夏天提出,该算法自提出以来经历了许多改进,并衍生出了许多变体,还被应用到了许多智能手机照片应用中。
神经风格迁移是将参考图像的风格应用到目标图像上,同时保留目标图像的内容。这里的风格主要指图像在不同空间尺度上的纹理、颜色和视觉模式,而内容则是图像的高层宏观结构。例如,在使用梵高的《星夜》作为风格参考时,蓝黄色的圆形笔触就是风格;而图宾根照片中的建筑则被视为内容。
在2015年神经风格迁移发展之前,风格迁移的想法在图像处理领域就已经有很长的历史,它与纹理生成密切相关。但基于深度学习的风格迁移实现所取得的结果,是经典计算机视觉技术无法比拟的,它引发了计算机视觉创意应用的复兴。
实现风格迁移的关键概念与所有深度学习算法的核心思想相同:定义一个损失函数来明确想要实现的目标,然后最小化这个损失。具体来说,要保留原始
超级会员免费看
订阅专栏 解锁全文
2303

被折叠的 条评论
为什么被折叠?



