Motivation:
recovering the geometry of a 3D shape from a single RGB image
常用的primitive-based representations 寻求推断在不同对象实例之间推断语义一致的part排列,并提供更具解释性的替代方法,而非仅注意提取全局物体。
现存的一些方法由于其简单的参数化,这些原语的表达能力有限无法捕捉复杂的几何图形。因此,现有的基于零件的方法需要大量的原语来提取几何上精确的重构。然而,使用更多的原语是以牺牲重建的可解释性为代价的。
Method:
Primitives as Homeomorphic Mappings
Network Architecture
用一个可逆的神经网络(Invertible Neural Network (INN))去学习预测形状的implicit and explicit representation,然后在预测的part上引入各种约束限制。试图学习一个简单的genus-zero形状的3D空间和目标空间的同胚,以便变形的形状匹配目标对象的一部分。文中的genus-zero shape选择为球(sphere)。