生成音乐与视觉艺术及生成对抗网络构建
一、生成音乐与视觉艺术
(一)GAN 生成图像原理
在生成图像方面,GAN(生成对抗网络)由生成器(Generator)和判别器(Discriminator)组成。生成器根据输入创建图像,图像需保留原始内容,并具有适当风格,以产生难以与原作区分的模仿作品。判别器则判断生成器的输出是否足够逼真,若不是,会向生成器反馈问题。
为使这一机制生效,需训练两个模型,生成器和判别器协同工作。生成器创建新样本,判别器指出每个样本的问题,二者不断交互,直至模仿作品达到特定的完美程度。与 CNN 相比,GAN 方法自动化程度更高,产生良好结果的概率更大,但实现耗时久,处理要求高。因此,若追求“足够好”的结果,CNN 方法通常更佳。可参考 此示例 了解 GAN 方法。
(二)使用网络创作音乐
虽然主要关注视觉艺术,但相同技术也适用于音乐。可以使用 CNN 和 GAN 根据特定风格创作音乐。计算机将音乐音调转化为数字,如同处理像素数字一样,本身并无区别。然而,深度学习能检测到差异,音乐和视觉艺术虽使用相同算法,但设置和训练不同。有观点认为音乐训练比艺术训练更难,这部分困难源于人类对音乐审美的差异,人类难以定义令人愉悦的音乐,即使喜欢特定风格或艺术家的人,也并非喜欢其所有作品。
在某些方面,使用 AI 创作音乐的工具比视觉艺术工具更规范、成熟。虽不意味着音乐创作工具总能产
超级会员免费看
订阅专栏 解锁全文
9万+

被折叠的 条评论
为什么被折叠?



