最新数字人开源代码-echomimic

github地址:GitHub - BadToBest/EchoMimic: Lifelike Audio-Driven Portrait Animations through Editable Landmark Conditioning

论文地址:

[2407.08136] EchoMimic: Lifelike Audio-Driven Portrait Animations through Editable Landmark Conditions (arxiv.org)

项目运行:

1、安装环境

#拉取代码
git clone https://github.com/BadToBest/EchoMimic
cd EchoMimic

#创建环境
conda create -n echomimic python=3.8
conda activate echomimic

#安装依赖
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

2、下载并解压ffmpeg-static

#指向解压后ffmpeg-4.4-amd64-static文件夹的位置
export FFMPEG_PATH=/path/to/ffmpeg-4.4-amd64-static   

3、模型下载

可以通过git clone从hugginface下载,也可以手动下载,地址为:https://huggingface.co/BadToBest/EchoMimic

git clone https://huggingface.co/BadToBest/EchoMimic pretrained_weights

在这里附上模型的夸克资源:

点击链接即可保存。打开「夸克APP」
链接:https://pan.quark.cn/s/0b8ccdfda5f9
提取码:T8dy

至此,环境准备完毕,可以进行推理

4、音频加图片推理

使用自己的图片加音频推理,在./configs/prompts/animation.yaml文件test_cases添加进自己的图片和音频路径:

test_cases:
  "path/to/your/image":
    - "path/to/your/audio"
运行
  python -u infer_audio2vid.py

结果保存地址推理完会显示

5、说明

资源消耗情况:8g显存可运行

推理速度较慢

### 阿里巴巴数字人相关开源项目与资源 阿里巴巴作为国内领先的科技公司,在人工智能领域进行了大量投入,尤其是在数字人技术和开源生态方面取得了显著进展。以下是关于阿里巴巴数字人相关开源项目的详细介绍: #### 1. **阿里云的通义千问** 阿里云推出的通义千问系列大模型不仅涵盖了自然语言处理能力,还涉及多模态生成技术,能够用于构建虚拟形象和交互式数字人[^1]。这些技术可以被开发者用来创建具有高度拟真效果的数字人物。 #### 2. **魔搭平台 (ModelScope)** 魔搭是阿里云推出的一个模型开放平台,提供了丰富的预训练模型供开发者下载、学习以及二次开发。其中包含了多个可用于数字人制作的技术模块,比如语音合成(TTS)、图像生成(GANs)等[^4]。 例如,可以通过以下命令克隆相关仓库来获取更多细节: ```bash git clone https://github.com/BadToBest/EchoMimic.git ``` #### 3. **数字孪生技术的应用** 虽然目前未见明确标注为“数字人”的独立开源项目,但阿里巴巴利用其强大的数字孪生技术支持了多项业务场景下的技术创新。例如,在供应链管理和库存优化中使用的数字孪生技术同样也可以迁移到数字人的动态行为建模上[^2]。 #### 4. **Spring Boot 架构适配** 对于希望基于现有框架快速搭建数字人服务端程序的研发人员来说,可以选择合适的 Spring Boot 版本来满足不同环境的需求。根据官方文档说明,如果目标运行时环境至少具备 JDK 17,则推荐采用最新版本即 3.0.x 分支;而对于仅支持较旧 Java 运行时的情况,则应考虑选用兼容性更好的低版次分支如 2.4.x 或者 2.7.x[^3]。 ### 示例代码片段展示如何初始化一个简单的 RESTful API 来服务于未来可能扩展成完整的数字人类应用的基础结构: ```java @SpringBootApplication public class DigitalHumanApplication { public static void main(String[] args) { SpringApplication.run(DigitalHumanApplication.class, args); } @RestController @RequestMapping("/api/digital-human") public class DigitalHumanController { @GetMapping("/{id}") public ResponseEntity<String> getDigitalHuman(@PathVariable String id){ return ResponseEntity.ok("Fetching digital human with ID:" + id); } } } ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值