AI 生成艺术的探索:从图像生成到笔触重组
本文探讨了利用 AI 生成艺术的两种方法:图像生成和笔触重组。
图像生成 利用VQGAN和CLIP技术,通过不断迭代生成符合文字描述的图像。CLIP负责衡量图像与描述的匹配度,VQGAN则根据匹配度调整图像。这种方法类似于AI“理解”文字描述并不断“尝试”生成符合描述的图像。
笔触重组 则使用名为“Clip Drawl”的技术,通过重新排列一组矢量笔触,利用CLIP衡量其与文字描述的匹配度,并不断调整笔触的位置和形状,最终生成符合描述的图像。这种方法更类似于AI“绘画”,通过调整笔触来创作艺术作品。
笔触重组的优势:
- 可以通过调整笔触数量和风格来改变最终结果,从简单的涂鸦到复杂的绘画都有可能。
- 可以指定负面提示,避免生成某些特征或风格的图像。
- 可以观察CLIP对图像的分类结果,并根据结果调整负面提示。
笔触重组的局限性:
- 生成的图像可能不够完整,例如无法生成完整的龙的细节。
- 生成效果依赖于CLIP的分类能力,CLIP的准确性会影响最终结果的质量。
本文还提到了CLIP在生成艺术中的作用,以及CLIP的分类能力如何影响最终结果的质量。作者最后鼓励读者尝试使用“Clip Drawl”技术,探索AI生成艺术的更多可能性。
CLIPDraw,可以涂鸦任何东西的 AI!在 VQGAN+CLIP 之后,我们又有了另一个可以涂鸦你说的任何东西的 AI!这是一个很棒的艺术生成器,在需要为小项目或我的 YouTube 视频制作可爱的草图时非常方便。CLIPDraw 真的被 VQGAN+CLIP overshadow 了 :/CLIPDraw:通过语言-图像编码器探索文本到绘图的合成[Colab] https://colab.research.google.com/github/kvfrans/clipdraw/blob/main/clipdraw.ipynb[博客] https://kvfrans.com/clipdraw-exploring-text-to-drawing-synthesis/[论文] https://arxiv.org/abs/2106.14843
726

被折叠的 条评论
为什么被折叠?



