该论文输入的是一个扫描的3d mesh,输出是一个顶点数的3d mesh。这个过程很像NICP的3d人脸配准过程,但是NICP是一个优化的过程。而该方法在学习好了网络后,可以直接使用。使用GPU的话,速度应该可以非常快。
该论文还为利用CNN重建3D人脸提供了另一种思路。目前看到的用CNN进行3D人脸重建,其输出要么是3DMM的系数(没有人脸的真是深度信息),要么是将mesh立方体化(一个n1×n2×n3的矩阵,顶点数不固定)。而该论文学习的是论文Learning the Multilinear Structure of Visual Data [1]中的核心张量M,并且预测每个mesh的重构系数 W W 。这样就能够使得预测出来的mesh顶点数一样;但是,对于是否能够预测出真实的人脸深度信息有待实验验证。