几篇近期的paper:
- 清华:音频驱动的具有自然头部姿势的语音人脸视频生成
- 谭铁牛:对步态识别的时间稀疏对抗性攻击
- Google Brain:无需专用硬件加速的混合精度量化
- 北大:SemanticPOSS-具有大量动态实例的点云数据集
1. 清华:音频驱动的具有自然头部姿势的语音人脸视频生成
类似于AI虚拟主播,根据声音生成视频,嘴型和头的姿态越来越自然……Fake News批量化生产指日可待【狗头】,先看一段视频,不是本文的Demo哈,是一张图片生成视频的:
语音人脸视频生成Demo
AI视频生成
标题:Audio-driven Talking Face Video Generation with Natural Head Pose
机构:清华、中科大、浙大
作者:Ran Yi, Zipeng Ye, Juyong Zhang, Hujun Bao, Yong-Jin Liu

最低0.47元/天 解锁文章
1876

被折叠的 条评论
为什么被折叠?



