关键词检索技术:现状与挑战
1. 领域名称的多样性
在文本图像关键词检索(KWS)领域,由于研究者背景和所属社区的不同,同一问题有着多种不同的名称。例如,语音处理社区广泛使用“语音术语检测(Spoken Term Detection,STD)”,尽管“关键词检索(Keyword Spotting,KWS)”过去也被该社区使用过,但近年来前者更为流行。
语音社区在该问题上的研究起步较早,对历史手写文档关键词检索研究贡献显著。一些用于手写文档关键词检索的流行策略就借鉴自语音社区。手写文本识别社区长期受益于语音识别领域的发展,如隐马尔可夫模型和高斯混合模型最初用于语音识别,后来被文本识别研究者采用,现代人工神经网络架构如长短期记忆网络也是如此。
在手写文档社区,许多研究者更喜欢使用“单词检索(Word Spotting)”这一术语,甚至在同一社区内,不同名称也可能指代同一问题,或者同一名称可能指代不同问题。为便于研究,我们通常使用“关键词检索(KWS)”这一术语,但如果要深入研究相关工作,还需关注以下主题:
- 关键词检索(Keyword Spotting)
- 语音术语检测(Spoken Term Detection,仅用于语音信号)
- 单词检索(Word Spotting)
- 单词检测(Word Detection)
- (语音或文本图像)搜索(Search)
- (语音或文本图像)检索(Retrieval)
- (语音或文本图像)索引(Indexing)
- (语音或文本图像)挖掘(Mining)
2. KWS方法的分类
不同的KWS系统和研究成果可以根
超级会员免费看
订阅专栏 解锁全文
1011

被折叠的 条评论
为什么被折叠?



