论文题目:Diffused Heads: Diffusion Models Beat GANs on Talking-Face Generation
论文链接:https://arxiv.org/abs/2301.03396
发表于:WACV 2024
单位:伦敦帝国理工学院等
项目主页:https://mstypulkowski.github.io/diffusedheads/
代码:https://github.com/MStypulkowski/diffused-heads
研究背景
- 研究问题:这篇文章要解决的问题是说话人脸生成,特别是如何在没有额外参考视频的情况下,生成具有自然头部运动和面部表情的视频。
- 研究难点:该问题的研究难点包括:生成自然的头部运动和面部表情、避免模式崩溃、处理大头部运动时的视频失真、以及无需额外指导的生成方法。
- 相关工作:该问题的研究相关工作有:早期的隐马尔可夫模型(HMMs)、深度学习方法、最新的基于生成对抗网络(GANs)的方法、以及扩散模型在图像和视频生成中的应用。