本文来源微信公众号:深度学习大讲堂,已授权发布。
作者:时学鹏,中科院计算所VIPL组15级硕士生。导师为山世光研究员。研究方向为基于深度学习的目标检测,特别是人脸检测。研发了VIPL课题组第五代人脸检测SDK。
原文:【Technical Review】ECCV16 Grid Loss及其在人脸检测中的应用
欢迎技术投稿、约稿、给文章纠错,请发送邮件至heyc@youkuaiyun.com
什么是人脸检测?简而言之,给定一张图片,判断图中是否有人脸,如果有人脸,进一步给出每一张人脸的位置和大小。这一看似简单的任务,在实际应用中却面临着诸多困难,其中之一就是当人脸被遮挡时,如何才能准确地进行检测。在ECCV 2016上,有一篇文章专门针对检测遮挡人脸的问题进行了探索:Grid Loss: Detecting Occluded Faces,该文章通过设计新的损失函数,综合考虑局部和整体信息对分类的作用,增强了检测器对遮挡的鲁棒性。
检测被遮挡的人脸,这一任务的难点在于,遮挡会导致一部分人脸特征缺失,取而代之的是遮挡物的特征,这不仅容易引起分类器误判,还容易造成漏检。解决遮挡人脸检测的问题可以从数据与算法两个方面切入。从数据方面入手的做法较为直接,即在分类器训练阶段,在正样例集中加入一定比例的带遮挡人脸,让分类器从数据中自动去学习带遮挡人脸的变化模式。数据驱动的方式也就意味着对数据的依赖,而遮挡的变化模式复杂多样,如果希望模型能对遮挡有较好的鲁棒性和泛化能力,那将需要非常大量的数据。从算法的角度入手,已有的一些工作在解决遮挡问题时,有些需要在训练