基于网络摄像头的视觉注视估计
1. 引言
在许多计算机视觉应用和研究中,眼睛定位、跟踪以及相关的视觉注视估计是重要的任务。常见应用包括驾驶和营销场景中的用户注意力与注视分析,以及为残疾人设计的控制设备。目前的眼睛定位/跟踪技术主要分为以下三种:
- 眼电图(Electro oculography):记录眼窝周围皮肤的电位差。
- 巩膜接触镜/搜索线圈(Scleral contact lens/search coil):使用安装在隐形眼镜上的机械参考装置。
- 光/视频眼动图(Photo/video oculography):利用图像处理技术定位眼睛中心。
然而,这些技术普遍存在使用侵入性和昂贵传感器的问题。光/视频眼动图虽被认为侵入性最小,但商用跟踪器仍要求用户配备头戴设备,或使用高分辨率相机并搭配下巴托以限制头部移动。此外,由于常使用主动红外(IR)照明来通过角膜反射获取准确的眼睛位置,该技术无法在日光下应用。非红外外观的眼睛定位器虽能成功定位眼睛区域,但无法准确跟踪眼睛运动。
本文的目标是提出一种将眼睛注视模式映射到屏幕上的方法,该方法基于以下几个要素:
- 一个能在低分辨率图像和视频(如普通网络摄像头拍摄的内容)中快速准确地定位和跟踪眼睛中心及眼角的眼睛跟踪器。
- 一个为眼睛中心和眼角定位提供尺度不变性的尺度空间框架。
- 一个将眼睛和眼角位置映射到屏幕坐标的映射机制。
2. 等中心点估计
图像的等照度线是连接具有相同强度点的曲线。由于等照度线互不相交,图像可以完全由其等照度线描述。此外,等照度线的形状与旋转和线性光照变化无关。为更好地说明等照度线框架,引入内在几何的概
超级会员免费看
订阅专栏 解锁全文
1323

被折叠的 条评论
为什么被折叠?



