小红书开源的一款文生图身份保持项目：StoryMaker，面部特征、服装、发型和身体特征都能保持一致！

最新推荐文章于 2025-04-23 07:13:16 发布

原创最新推荐文章于 2025-04-23 07:13:16 发布 · 1.4k 阅读

CC 4.0 BY-SA版权

文章标签：

部署运行你感兴趣的模型镜像

创作故事场景时，如何让每个角色保持身份一致，并且还能在多个角色之间做到统一的风格？这是很多自媒体人在做连续内容创作时遇到的难题。

而如今，小红书开源的一个项目—StoryMaker，为创作者提供了一种全新的文生图解决方案。通过保持角色面部特征、服装、发型和身体特征的连贯性，StoryMaker让创作多角色、连续叙事的图像内容变得简单而高效。

StoryMaker 是一个基于文生图的开源项目，旨在帮助创作者保持角色在多张图片中的一致性。它集成了Stable Diffusion XL模型，并使用LoRA技术增强生成图像的保真度与质量。通过该工具，创作者可以轻松生成带有叙事性、具有多个角色且保持特征一致的图像内容。

这个项目特别适合需要生成连续故事场景的创作者，比如插画师、设计师或者AI故事视频等，他们可以通过StoryMaker保持每个角色的独特特征，同时还能在整个创作过程中保持风格一致。

最令人称道的功能之一便是其保持角色一致性的能力。StoryMaker能够准确保留每个角色的面部特征、服装、发型和身体特征，这对于多角色的连续场景创作尤为重要。

StoryMaker支持在同一场景中处理多个角色，确保每个角色在不同场景中的特征保持不变。这对于那些需要在复杂叙事场景中引入多角色的创作者来说，是个极大的优势。你无需担心不同图片中的角色出现“走样”问题。

通过系列图像和文本提示，StoryMaker可以帮助创作者构建出完整的叙事性内容。创作者只需提供一些简单的文本提示，StoryMaker就能生成符合故事情节的连续图像，为你的故事增加更强的视觉吸引力。

StoryMaker集成了Stable Diffusion XL模型，这是一种生成图像质量极高的扩散模型。同时，它使用了LoRA技术（Low-Rank Adaptation of Large Models），使得生成的图像不仅质量高，还能够保持更高的细节和一致性。

模型集成的优势让StoryMaker不仅仅是一个图像生成工具，更是一个可以根据创作者的需求，灵活生成符合叙事逻辑和艺术需求的图像神器。

StoryMaker的强大功能使其在多个创作领域具有广泛的应用场景：

漫画创作往往需要角色在不同情节中保持外观一致。StoryMaker通过保持角色的面部、服装、发型等特征一致性，极大简化了漫画创作中的重复性工作。

在游戏开发中，设计多个角色并保证他们在不同场景中的外观一致非常重要。StoryMaker可以帮助游戏设计师快速生成符合要求的角色，并保持其一致性。

为写作故事生成插画时，StoryMaker可以根据文字提示自动生成相关的图像内容，帮助作家或插画师轻松构建具有叙事性的图像内容，提升作品的吸引力。

对于广告创意团队或影视制作团队，StoryMaker可以帮助快速生成场景设定，并且在角色和场景风格保持一致的情况下，灵活制作多个创意方案。

StoryMaker项目已在GitHub上开源，可以通过以下步骤快速上手：

1、获取代码

前往GitHub仓库：StoryMaker 下载项目代码。仓库中提供了详细的安装与使用说明，帮助用户快速搭建起本地环境。

2、使用HuggingFace模型

StoryMaker所使用的Stable Diffusion XL模型已经在HuggingFace上发布，用户可以通过该平台下载和使用模型。访问 HuggingFace 下载并加载模型文件。

StoryMaker通过其强大的特性，彻底改变了多角色叙事创作的方式。它不仅能帮助创作者快速生成高质量的连续图像，还能确保每个角色的特征始终保持一致，无需反复进行人工调整。这对于需要高效输出作品的创作者来说无疑是一个巨大优势。

如果你是一名插画师、漫画创作者，或者是对叙事性创作感兴趣的开发者，那么StoryMaker将成为你创作路上的得力助手。

项目地址：https://github.com/RedAIGC/StoryMaker

模型地址：https://huggingface.co/RED-AIGC/StoryMaker

您可能感兴趣的与本文相关的镜像

Stable-Diffusion-3.5

图片生成

Stable-Diffusion

Stable Diffusion 3.5 (SD 3.5) 是由 Stability AI 推出的新一代文本到图像生成模型，相比 3.0 版本，它提升了图像质量、运行速度和硬件效率