AI丨部署SadTalker并添加到Stable Diffusion

最新推荐文章于 2025-04-11 16:59:54 发布

互联网王德发

最新推荐文章于 2025-04-11 16:59:54 发布

阅读量1.7k

点赞数 15

本文链接：https://blog.youkuaiyun.com/2401_84250614/article/details/138189839

版权

前言

Stable Diffusion是一种潜在扩散模型（Latent Diffusion Model），能够从文本描述中生成详细的图像。它还可以用于图像修复、图像绘制、文本到图像和图像到图像等任务。

如何配置Stable Diffusion部署本地AI绘画？

SadTalker模型，通过从音频中学习生成3D运动系数，使用全新的3D面部渲染器来生成头部运动，可以实现图片+音频就能生成高质量的视频。

现在，可以在SD上部署SadTalker插件实现以上内容。

github链接：https://github.com/zhoubx/OpenTalker-SadTalker

准备:电脑配置需求（SD）

操作系统:windows10以后

CPU:不做强制性要求

内存：推荐8G以上

显卡：必须是Nvidia独立显卡，显存最低4G，推荐20系以后

整合包推荐放在固态硬盘中，提高模型加载速度

_演示电脑：_Lenovo Legion R7000P（联想拯救者R7000P）

显卡 Nvidia RTX 4060 laptop 内存 16G

SadTalker还有很多需要优化的地方，对显存要求较大，而且生成速度比较慢。

操作方法

1.配置python环境.

Sadtalker是Python的程序，此处我们安装Python虚拟环境管理器：anaconda。我们在往期内容中介绍过anaconda,此处不过多赘述，详情可以移步这期推送。

AI丨机器学习丨PyTorch环境的配置及安装<

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

互联网王德发

关注关注

15
点赞
踩
27

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

AI 绘画 | Stable Diffusion 视频数字人

洛阳泰山的博客

12-15

1120

本篇文章教会你如何利用Stable Diffusion WEB UI，使用一个人物图片转换成为一个口播视频。本篇内容的教程以WINDOWS系统为例，教你如何安装使用。先看视频效果彭于晏图片生成口播视频。

[Stable Diffusion]：WEBUI（SD）安装、常用模型（checkpoint、embedding、LORA）、提示词具、常用插件

细节控-AI先行者的博客

12-09

2536

Stable Diffusion是一款令人印象深刻的AI模型，它让我们能够创造出惊人的艺术作品。通过安装合适的Checkpoint文件、使用Embeddings、LORA和Hypernetwork，以及使用插件，您可以发挥Stable Diffusion的最大潜力，创造出独一无二的艺术作品。

参与评论您还未登录，请先登录后发表或查看评论

在Stable Diffusion WebUI中安装SadTalker插件时几种错误提示的处理方法

m0_60659514的博客

10-04

3155

比如我在安装SadTalker时，就遇到很多问题，一度放弃了，后来查了一些网上攻略，自己也反复查看日志，终于解决，不吐不快。一、在Stable Diffusion webui中安装SadTalker插件后，重启Stable Diffusion WebUI，在界面中没有出现SadTalker标签。经过修改后，再次启动WebUI，终于能看到SadTalker标签了，选择图像，选择声音文件，调整参数，生成，程序终于欢快地跑起来了。二、插件运行过程中，前端视频生成框中提示Error(错误)，过程中止。

Stable Diffusion WebUI安装SadTalker插件

07-27

4483

stable diffusion 安装 sadtalker，生成你自己的2D数字人

记录SDWebUI 1.10.1成功安装SadTalker

最新发布

JQ_18的博客

04-11

664

记录SDWebUI 1.10.1版本安装音频驱动图片合成对口型视频插件SadTalker及相关问题解决方案

将数字人--sadtalker以插件的方式集成到Stable Diffusion中

BBM的博客

01-04

1579

Sadtalker在数字人领域因其消耗资源少，节省GPU资源等优点，被不少人喜爱，但他提供的WEBUI调试非常不方便，将Sadtalker以Stable Diffusion插件的方式集成在一起，可以更方便大家使用，接下来，我就介绍一下，如何将Sadtalk以插件的方式集成到Stable Diffusion中。

打造AI虚拟数字人，Stable Diffusion+Sadtalker教程

强化学习曾小健

07-24

1446

恭喜你，你已经完成了使用Stable Diffusion和Sadtalker结合起来，实现从文本到视频的生成的教程。你可以在output文件夹中找到你生成的视频，并用任何视频播放器观看它。你也可以尝试用不同的文本描述和音频来生成不同的视频。希望你能享受这个有趣的创作过程，并发挥你的想象力和创造力。

SadTalker数字人服务器部署

liu289747235的专栏

07-14

877

问题2： python3.10/site-packages/torch/lib/libtorch_cuda.so: undefined symbol: ncclCommRegister。最终：stable-diffusion-webui/openai/clip-vit-large-patch14。链接：https://pan.baidu.com/s/1GeASwRZeX81ef738WG3Kiw。解压stable环境的python到/usr/local/miniconda3/envs/

Mac M2环境下安装和调试SadTalker

轩哥的博客

09-14

1346

SadTalker 是一款开源的人工智能工具，能够将静态人像图片转化为逼真的说话视频。用户只需上传一张正面肖像照片和相应的音频文件，SadTalker 便能通过分析音频来同步照片中人物的嘴唇动作和面部表情，创造出栩栩如生的视频效果。这一技术适用于个性化信息传递、教育内容制作等多样化场景，支持商业和个人项目使用。SadTalker 的开源特性意味着用户可以自由下载、修改和再分发代码，同时，其高效的同步算法和自然动画效果使其在数字人技术领域中独树一帜。

一步一步学习 Stable Diffusion

engchina的专栏

06-03

1196

一步一步学习 Stable Diffusion

Stable Diffusion能让图片也能开口说话？别惊讶！用SadTalker插件，一键生成自己的数字人（附资料）

A1353192296的博客

04-23

1626

感兴趣的小伙伴，赠送全套AIGC学习资料，包含AI绘画、AI人工智能等前沿科技教程和软件工具，具体看这里。AIGC技术的未来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断提高。未来，AIGC技术将在游戏和计算领域得到更广泛的应用，使游戏和计算系统具有更高效、更智能、更灵活的特性。同时，AIGC技术也将与人工智能技术紧密结合，在更多的领域得到广泛应用，对程序员来说影响至关重要。未来，AIGC技术将继续得到提高，同时也将与人工智能技术紧密结合，在更多的领域得到广泛应用。

尝试着在Stable Diffusion里边使用SadTalker进行数字人制作

qq_42108074的博客

01-19

1853

我使用的基础软件是Stable Diffusion，SadTalker是作为插件放进来的，需要注意的是这对自己的电脑GPU要求比较高，至少需要8G，至少我的电脑是8G显存。点击扩展，选择从网址安装，然后把git仓库https://github.com/OpenTalker/SadTalker.git放入指定的位置，然后点击安装。先下载下载并安装ffmpeg，这一步的作用是语音格式的各种转换，虚拟数字人能开口说话，需要我们上传自己的语音，如果格式不符合会自动转换。然后我解压到D:\VideoSoft目录下。

使用sad talker制作AI数字人视频-【Stable Diffusion 实战教程】

红老属爱学习的专栏

03-30

1565

打开stable diffusion 中扩展栏目，从网页下载sad talker插件，下载完之后可以在installed处检查会出现sadtalker的标志，如果有就下载成功了，如果没有可能是因为网络原因，多试几次，如果不行那就上gitup下载，并把下载后的插件放到sd栏目中的，E:\stable-diffusion-webui\extensions文件中。插件需要的基础模型，如：预训练模型、构造脸部说话姿势等工具模型。的插件的运行需要我们下载两部分内容，一部分是。插件所需要的模型与离线包文件。

Stable Diffusion WebUI安装合成面部说话插件SadTalker

培根芝士的专栏

12-29

2092

SadTalker可以根据一张图片、一段音频，合成面部说这段语音的视频。图片需要真人或者接近真人。

如何在windows上本地部署SadTalker，实现AI数字人

qq_43335960的博客

06-20

7191

解压：ffmpeg-6.0-full_build-shared.zip 到根目录（例如：c:\ffmpeg-6.0-full_build-shared）解压：ffmpeg-6.0-full_build-shared.zip 到根目录（例如：c:\ffmpeg-6.0-full_build-shared）下载：ffmpeg-6.0-full_build-shared.zip。下载：ffmpeg-6.0-full_build-shared.zip。安装依赖并启动：python Launcher.py。

【虚拟数字人】SadTalker简易部署教程

AI知识搬运工

08-01

3372

视频教程在这里：sadtalker数字人创建简易教程项目基于SadTalkers实现视频唇形合成的Wav2lip。通过以视频文件方式进行语音驱动生成唇形，设置面部区域可配置的增强方式进行合成唇形（人脸）区域画面增强，提高生成唇形的清晰度。使用DAIN 插帧的DL算法对生成视频进行补帧，补充帧间合成唇形的动作过渡，使合成的唇形更为流畅、真实以及自然。

【SadTalker】源码部署&搭建HTTP服务

Java技术栈，分享不断学习、不断超越、不断积累的历程！

02-29

1363

提供HTTP接口，就能方便被其它系统调用了，编写一个。如果使用CPU运行，则加上。

基于SadTalker的AI数字人模型部署

a287100886的博客

02-14

884

基于SadTalker的AI数字人模型部署

（三）SadTalker 让stable diffusion 人物可以说话

西风瘦马

05-01

5951

可以根据一张图片、一段音频，合成面部说这段语音的视频。图片需要真人或者接近真人。目前项目已经支持,可以SD出图后，结合一段音频合成面部说话的视频（抖音常见的数字人）

Ubuntu下部署Stable Diffusion并指定k-diffusion版本

资源摘要信息: "在Ubuntu系统下部署Stable Diffusion模型时，确保使用了指定版本的k-diffusion库" 知识点详细说明： 1. Ubuntu系统基础： Ubuntu是一个基于Debian的Linux操作系统发行版，广泛用于服务器和个人电脑...