ASR:automatic speech recognize ,语音识别技术,语音转换为文本
TTS:text to speech ,文本转语音技术
audio2face:音频转表情技术《重点*********》

其中,audio2face的代表算法有facegood
wav2lip:声音到嘴唇算法
百度安全验证
https://baijiahao.baidu.com/s?id=1722621345023280547&wfr=spider&for=pc百度安全验证
https://baijiahao.baidu.com/s?id=1722472024679803706&wfr=spider&for=pc
先从最简单的wav2lip研究开始:
嘴型同步模型Wav2Lip_我的个人网站: https://xugaoxiang.com-优快云博客
ffmpeg工具windows/linux安装离线下载:Builds - CODEX FFMPEG @ gyan.devhttps://github.com/BtbN/FFmpeg-Builds/releases(需要认证,未成功)
ffmpeg linux版本下载:
中文的可以使用paddle的预训练wave2lip模型:基于Wav2lip实现精准唇形合成 - 知乎
本文主要介绍了音频转脸(audio2face)技术中Wav2Lip模型的详细研究,包括Wav2Lip模型的应用、个人网站资源及ffmpeg工具的安装教程,重点讲解了基于Paddle的预训练Wave2Lip模型在唇形合成中的实践。
786

被折叠的 条评论
为什么被折叠?



