空中书写文本识别技术:原理、应用与实践
1. 相关工作
在文本识别领域,众多研究人员提出了不同的空中书写识别技术。以下是一些具有代表性的研究:
- Alam M.S. 等人 :提出基于轨迹的空中书写字符识别技术,使用 CNN 分类器,在 10 名 23 - 30 岁研究生(8 男 2 女)手动构建的数据集上准确率达 97.29%,但部分字符识别率较低。
- Bastas 等人 :比较了 TCN、CNN、LSTM 和 BLSTM 模型在少量收集数据上的空中书写识别效果,得出 LSTM 准确率最高,达 99.5%。
- Chen Y. H. 等人 :为智能眼镜中的空中书写提出了 mask R - CNN 和三层 CNN 模型,通过指尖检测实现,利用 Google API 识别书写字符。
- Rahman 等人 :提出使用 RNN - LSTM 网络的空中书写识别系统,能消除噪声并识别数字,在 MNIST 数据集上,单数字和多数字英文数字的准确率分别为 98.75% 和 85.27%。
- Roy 等人 :提出使用卷积神经网络(CNN)的技术,用固定颜色标记在相机前做手势,通过基于颜色的分割识别标记尖端及其轨迹,使用三种不同语言的数据集,准确率分别为 97.7%、95.4% 和 93.7%。
- Alam 等人 :使用卷积神经网络与长短期记忆网络(CNN - LSTM)的融合,使用 RTD 和 RTC 数据集,包含 20,000 个数字和 3
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



