基于网络摄像头的视觉注视估计与实时人脸概率跟踪
1. 基于网络摄像头的视觉注视估计
在视觉注视估计的相关研究中,研究人员进行了一项简单任务,即检查注视点是否落在相应的图像区域内,该任务达到了 95% 的准确率。为了让读者了解系统的实际工作情况和能力,还录制了两个视频,可通过以下链接访问:
- http://www.science.uva.nl/∼rvalenti/downloads/tracker.wmv
- http://www.science.uva.nl/∼rvalenti/downloads/tracking.avi
研究人员将推断眼睛中心位置的方法扩展到眼角检测。眼睛中心和眼角可以同时被检测,不需要额外的大量计算,并且检测具有尺度不变性。利用估计的位置来估计坐在屏幕前的用户的视觉注视方向。虽然系统的准确性受所用网络摄像头质量的限制,但研究人员认为近似的注视信息对于分析受试者的注视模式是有用的。该方法的主要优点包括:
- 不需要任何专用设备;
- 无需训练,具有很高的灵活性;
- 实时性强;
- 能给出合理的准确性。
2. 实时人脸概率跟踪
2.1 引言
人脸检测和跟踪有两种常见方法:基于帧的方法和检测与跟踪相结合的方法。基于帧的方法不利用时间信息,连续检测之间的独立性使得难以重建每个受试者的轨迹。而检测与跟踪相结合的方法可能会丢失信息,且跟踪依赖于对采集条件敏感的低级特征。为克服这些缺点,研究人员提出在贝叶斯框架下将人脸检测和跟踪更紧密地结合起来。
每个面部在视频流的第 t 帧由状态向量 $x_t$ 表征,跟踪的目标是根据截至该时刻的所有测量值
超级会员免费看
订阅专栏 解锁全文
1316

被折叠的 条评论
为什么被折叠?



