Deep Alignment Network: A convolutional neural network for robust face alignment

论文介绍了一种级联的神经网络结构,用于实时面部地标跟踪。作者提出了利用前一帧预测结果来预测下一帧位置的方法,通过连接层生成地标热图、特征图像和变换,以进行仿射变换。该网络结构包括多个阶段,每个阶段由多个层组成,提取全局图像特征以解决定位问题,实现实时性能并保持高准确性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文分析

论文提出了一种类似级联的神经网络结构。这一点上很遗憾,我在一个月之前也想到了这种模式。因为对于实时 Landmark 的跟踪,其实可以利用上一帧的预测结果来预测下一帧 Landmark 的位置。但现代大部分的 CNN 结构没办法办到。在与朋友的讨论中可以仿照RNN来建立时间线上的联系,解决在实时跟踪中的效率及时间稳定性。当时想动手设计并实现一个这样的网络,后来因为公司原因并没有动手,想法搁置。结果今天就看到 CVPR2017 上的这篇论文。看来以后有想法还是直接撸吧!


初窥网络架构

我自己原有的想法是,在测试阶段:对于一个输入 I ,给定一个初始形状 S0 S 0 。每一级神经网络输出的是根据输入图像得到的偏移估计 ΔS

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值