智能印度手语识别系统:全面解析
1. 引言
手语(SL)是听力或言语障碍人士的一种替代交流方式。它是一种非语言的交流形式,通过身体的多个部位,包括手部位置、手指姿势等手动元素,以及面部表情和嘴唇动作等非手动元素,以视觉方式传递信息。不同国家的手语有所不同,例如美国手语(ASL)、中国手语(CSL)、英国手语(BSL)和印度手语(ISL)等。
ISL比其他手语更为独特和复杂,它包含单手和双手手势,并且有大量相似的手势,这使得设计用于识别ISL的手语识别系统(SLRS)成为一项具有挑战性的任务。在传统方法中,需要人类翻译作为听力/言语障碍人士与正常人之间的中介,但人类翻译并不总是可用,而且成本较高,还可能影响保密性和准确性。因此,研究人员正致力于开发ISL识别系统,以填补这一交流鸿沟。
在印度,约有270万聋哑人,其中98%使用ISL进行交流。官方的ISL词典包含约6000个单词,并且新词不断更新。近年来,用于ISL识别的方法主要分为基于传感器的方法和基于视觉的方法。基于传感器的方法通过数据手套、惯性测量单元(IMU)和Leap Motion控制器(LMC)等硬件设备和运动传感器收集数据,但会限制手语者的手部动作,不适合实时应用。而基于视觉的方法使用光学设备收集数据,手语者无需携带硬件设备,可以自由地进行手势,因此受到了更多的关注。
对于识别问题,SLRS采用了多种机器学习和深度学习方法。机器学习算法通过数字图像处理(DIP)技术和形态学操作提取特征,并将其输入到各种分类器中进行分类。根据手势的不同,手语可分为静态手势和连续手势。机器学习算法在静态手势识别方面表现良好,但在连续手势识别方面效果不佳,因为连续手势识别涉及到序列数据。近年来,深度学习技术发展迅速,卷积
超级会员免费看
订阅专栏 解锁全文
50

被折叠的 条评论
为什么被折叠?



