助力视障人士:移动全景视觉与指戴相机文本阅读系统
1. 移动全景视觉系统
移动全景视觉系统旨在帮助视障人士在室内环境中进行定位和导航。该系统结合了智能手机的全景相机和高性能服务器架构,既保证了用户端的便携性和移动性,又能利用服务器端强大的存储和计算能力。
1.1 图像预处理
- 图像矫正 :使用带有已知3D信息的校准目标对GoPano镜头拍摄的图像进行径向方向矫正,使未扭曲的圆柱图像在垂直方向上的投影为线性透视投影,同时确定垂直方向的有效焦距。矫正后,图像坐标(u, v)从(xe, ye)转换而来,u方向(水平方向)代表360度全景视图,v方向(垂直方向)为透视方向。
- 特征提取 :不直接比较帧的像素值,而是从HSI或HSI梯度曲线的FFT中提取旋转不变特征。这些曲线通过投影图像帧的感兴趣区域(ROI)获得,当前ROI为手动确定的矩形,以排除不同时间变化较大的地板区域。从每个矫正后的圆柱图像中提取六条全向投影曲线,三条来自图像的H、S和I通道,另外三条来自H、S和I通道的梯度幅值。梯度幅值图像的计算公式如下:
[|∇f(u, v)| = |\frac{\partial f}{\partial u}du + \frac{\partial f}{\partial v}dv|]
其中,f可以是H、S和I,(\frac{\partial f}{\partial u})是u方向的梯度,(\frac{\partial f}{\partial v})是v方向的梯度。梯度值的大小是((\frac{\partial f}{\partial u}, \frac{\par
超级会员免费看
订阅专栏 解锁全文
893

被折叠的 条评论
为什么被折叠?



