面向盲人用户的实时目标检测与音频输出系统
1. 引言
感知和理解周围环境的能力对人类生存至关重要,视觉和听觉在这一过程中起着关键作用。然而,对于视障人士来说,世界充满挑战且常常让他们感到孤立。他们难以独立看清和导航周围环境,而技术在提升视障人士的独立性和生活质量方面可以发挥重要作用。
实时目标检测和音频输出系统作为一种有前景的技术,可帮助视障人士行动。该系统利用摄像头传感器实时检测目标,并将其转化为用户可理解的音频信号,使视障人士能安全、独立地导航环境,提高生活质量和自我依赖感。
本项目旨在开发一个使用 YOLOv3 算法和 360 度摄像头传感器的实时目标检测与音频输出系统,该系统能检测和识别用户环境中的目标,并向用户提供音频输出。360 度摄像头传感器可提供用户环境的全面视图,能从各个角度检测目标,在有障碍物或复杂布局的环境中尤为有用。
2. 背景
目标检测多年来一直是计算机视觉领域的活跃研究课题。YOLOv3 是最流行和成功的目标检测框架之一,以速度和准确性著称。它使用深度卷积神经网络(CNN)在图像中检测目标,并能在各种硬件平台上实时执行此任务。
近年来,有多项研究探索了使用目标检测辅助视障人士。例如,Sai Nikhil Alisetti 等人提出了基于深度 CNN 的预测目标跟踪系统,用于引导盲人导航;Maid 等人专注于为盲人用户开发目标检测系统;Sagana 等人展示了视障人士的目标识别系统。
此外,360 度摄像头的使用越来越广泛,它能捕捉环境的 360 度视图,适用于虚拟现实和增强现实等应用。W. Yang 等人提出了针对 360 度摄像头捕获的等距矩形全景图像的目标检测系统。
超级会员免费看
订阅专栏 解锁全文
59

被折叠的 条评论
为什么被折叠?



