在数字人这条赛道上,清华深研院(Tsinghua SIGS)和国际数字经济研究院(IDEA)的中国团队,甩出一张王炸:GUAVA。
一张照片,0.1秒后,3D高斯化身(3D Gaussian Avatar)就站在你面前了,在512x512分辨率,实时驱动,帧率飙到50FPS以上。这速度,这效果,这成本,简直是把传统数字人制作流程按在地上摩擦,“还有谁?”

长久以来,构建一个高质量、可驱动的3D数字人,一直是计算机视觉领域的“圣杯”,也是个“苦活累活”。要么得架一堆摄像机搞多视角拍摄,要么就得拿一段视频慢慢“喂”给模型去训练,没个把小时根本下不来。更别提那些基于SMPLX(富有表现力的人体模型)的方法,身体是能动了,但脸跟“面瘫”似的,手也跟“鸡爪”一样,而且抖动厉害,根本没法看。
效果到底有多炸?


与其他算法比较:


最低0.47元/天 解锁文章
1051

被折叠的 条评论
为什么被折叠?



