论文分析
论文提出了一种类似级联的神经网络结构。这一点上很遗憾,我在一个月之前也想到了这种模式。因为对于实时 Landmark 的跟踪,其实可以利用上一帧的预测结果来预测下一帧 Landmark 的位置。但现代大部分的 CNN 结构没办法办到。在与朋友的讨论中可以仿照RNN来建立时间线上的联系,解决在实时跟踪中的效率及时间稳定性。当时想动手设计并实现一个这样的网络,后来因为公司原因并没有动手,想法搁置。结果今天就看到 CVPR2017 上的这篇论文。看来以后有想法还是直接撸吧!
初窥网络架构
我自己原有的想法是,在测试阶段:对于一个输入 I ,给定一个初始形状 S0 S 0 。每一级神经网络输出的是根据输入图像得到的偏移估计 ΔS