看完 50000 张专辑封面后,AI 设计师疯狂输出

西班牙艺术家利用StyleGAN2训练了一个AI设计师,通过50000张Spotify专辑封面自学成才,生成抽象派专辑封面。AI在学习过程中形成了独特的设计规范,尽管部分作品风格诡异,但展示了从模仿到创新的过程。此外,艺术家还用这些封面制作了卡点音乐MV,与音乐同步,展现了AI在创意设计上的潜力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

西班牙艺术家利用 StyleGAN2 打造了一个 AI 设计师,借助 50000 张图像自学成才,没想到培养一个印象派设计师这么简单。

作者 | 三羊

来源 | HyperAI超神经

头图 | 网友整理抄袭事件的对比图

也许是有些设计太经典出挑,总是让人情不自禁地模仿。

日前,乘风破浪走向观众视线的孟佳发布新歌,专辑封面被指原封不动地抄袭抄袭 ins 网红。

没多久,演员宋祖儿的造型设计,也被指出像素级抄袭韩国明星专辑封面,甚至连原创水印都没去掉,可见在设计创意的确不容易。

从事创意工作的人,难免灵感枯竭,有意无意地参考、借鉴、模仿他人的作品。面对网友的声讨,不仅明星丢了颜面,设计师也失了水准口碑。

50000 张专辑封面,AI 设计师自学成才

同样是搬运后的二次创作,工具属性的 AI 似乎更理直气壮。西班牙鬼才艺术家 Bruno López,基于 50000 张 Spotify 上的专辑封面,让 NVIDIA 神器 StyleGAN2 自学成才, “进化”出了一个“没有感情的、抽象派专辑封面 AI 设计师”。

StyleGAN2 随机生成的专辑封面

StyleGAN2 从 50000 张 Spotify 专辑封面中,很快形成出一套自己的设计规范和风格流派。

真实的专辑封面基本上由两部分构成,文字及主视觉元素

AI 的训练过程类似人类「看图画找规律」,在专辑封面的布局上,AI 看起来也深谙黄金比例、斐波那契数列、三分法等尺寸比例规范。

不过 AI 生成的专辑封面整体画风略微有些「诡异」,部分封面甚至可以用「恐怖」来形容:面容狰狞的人脸,少了一只眼球的眼睛,看不出是海浪还是动物尸骨的背景……更不用提模糊的文字、阴郁的色调。

StyleGAN2 随机生成的专辑封面,虽然画风清奇,但是配色及布局相对合理

除了受训练样本风格的影响外,这些伪影的出现也与模型本身有关。因为这 50000 个训练数据,均来自 Spotify 的编辑推荐榜单。没有限定音乐艺术风格,这导致单个风格的训练数据不足,出现了较为严重的伪影和斑点。

StyleGAN2 中用标准化代替归一化,可以去除图像中的特征伪影

StyleGAN 是一种全新的生成器网络结构,由 NVIDIA 发布。这一模型借鉴了风格迁移的相关技术,可以将目标物体的主要属性,逐层修改输入。

由于 AdaIN 中的实例归一化的存在,会导致风格迁移过程中丢失一些输入的关键信息,这就导致了生成图像中斑点及伪影的存在。

StyleGAN2 是 StyleGAN 的升级版,提升了生成图像的质量,极大减少了特征伪影的出现,在细节处理上也更加精细。

用 AI 画的封面,生成卡点音乐 MV

要想训练一个成熟的 AI 设计师,少不了训练数据和预训练模型。Bruno López 介绍了「AI 设计师」的诞生过程,还用这些封面做了一个抽象的 MV (音乐录影带)。

  创建数据集:

1、找到 Spotify 中对应的 API,给定专辑 ID 可返回多个元数据,包括专辑封面。

2、写爬虫脚本,爬取 Spotify 编辑推荐列表中的专辑曲库,并下载专辑封面。

3、获取一个数量约为 50000,图像分辨率为 640x640 的数据集。

在 Spotify 中调用对应的 API

训练过程:

作者在 Google Colab Pro 中,用原始 StyleGAN2 的 skyflynil 实现进行了训练。过程耗时数天,在 50000 个 周期后停止。

单纯地依靠 AI 生成略显粗糙的专辑封面,在大艺术家 Bruno López 看来还差点意思。

而火遍社交网络的卡点视频,让他灵光乍现。

  制作卡点视频:

作者基于 lhzbrian 写了一个 Python 脚本,创建随机潜在向量(random latent vector),随后对这些向量进行插值,以创建一个由 AI 生成的动画过渡。

为了让动画跟歌曲同步,作者非常机智地使用了 PyDub,让插值的速度跟每一帧的节拍音量同步。

最后,利用 Pillow 的 Image 模块及 OpenCV 的人脸检测功能,脚本就能只使用潜在向量,生成具有指定特征(如不包括人脸的黄色专辑封面)的图像。

Bruno 还非常体贴地考虑到了观众体验,毕竟一个数秒的片段总有种意犹未尽的感觉。为了让最终成片更具有观赏性,Bruno 想到了排列组合。

他先是生成具有不同属性的多个片段,然后用Premiere 压成一个视频,这就是最终的「Interference 音乐视频」成片。

风格迁移,创意也迁移?

在艺术上,创作与模仿的边界在哪里?

从创作过程来说,艺术创作都是从临摹开始,临摹大自然,临摹社会。StyleGAN2 在学习生成专辑封面的过程中,充分再现了从临摹他人到形成个人风格的过程。

画家齐白石主张艺术「妙在似与不似之间」,他的画风格清新、星神兼备,自成一派。其实齐老在早年间,也是从临摹他人画作开始的。在不断地鉴赏、临摹、思考中,逐渐找到了自己的个人风格。

据央视纪录片记载,齐白石早年也曾临摹他人画作

再反观「设计界的搬运工」的像素级抄袭,署上自己的大名,甚至用于商业获利。从业务能力和职业道德上来看,这些创作者确实还不如 AI。

您觉得呢?#欢迎来评论区聊聊#

参考:

https://arxiv.org/pdf/1912.04958.pdf

https://thenextweb.com/neural/2021/03/08/ai-music-video-deep-learning-algorithm-stylegan2-album-covers-spotify-gans/

https://docs.google.com/document/d/1qePvtKTJ3lbpxKfiJ1cn0wAVLazza0Zux4Lb-aTHuBE/edit?usp=sharing

2020年度中国开发者调查报告重磅来袭,直接扫码或微信搜索「优快云」公众号,后台回复关键词「开发者」,快速获取完整的报告内容!



☞网传阿里一总裁 PPT 被员工拍照泄漏,新规划遭曝光
☞首次曝光!腾讯新任 H4 级高管余仁杰提议将公司总部搬往南极
☞年薪 50 万!淘宝重金招聘,35 岁以上优先,学历不限
☞雷军哽咽:我愿押上人生全部声誉,为小米汽车而战!
☞那些跳槽做程序员的人,后悔了吗?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值