手写文档识别技术现状与发展
在手写文档处理领域,存在着诸多挑战与技术发展。以下将详细探讨缩写词处理、多词查询以及手写文本识别(HTR)模型与方法的相关内容。
缩写词处理
大多数手写文本识别(HTR)工作在处理缩写词时,通常会选择直接准确识别缩写部分(在字符层面),这常被称为外交或古文字转录。然而,历史文档在缩写规则上缺乏一致性和同质性,缩写后的词往往具有歧义,只有借助周围文本提供的上下文信息,才能明确缩写词的正确扩展形式。
在HTR领域,直到近期才开始明确考虑这一问题。从用户需求角度来看,若要实现高效的单词搜索,让用户自行推测所需查找单词的可能缩写形式是不可接受的。目前,针对文本图像中缩写词搜索这一特定问题,除了少数相关工作外,尚未得到广泛关注。
多词查询
在文本图像关键词搜索(KWS)方面,绝大多数工作仅考虑单词查询。但在实际的信息搜索应用中,支持基于多词的查询是必要的。在大规模应用场景下,用户期望能够像在电子文本(如互联网)中搜索信息一样,使用常规的搜索功能,如支持词序列和布尔AND/OR词组合查询。
KWS在语音文档领域(常被称为口语术语检测)的发展相对更为成熟,已有大量工作支持常见的多词查询形式。不过,这些方法和技术并不直接适用于文本图像搜索。
在专门处理文本图像的工作中,仅有一篇论文描述了一种简单的方法,通过组合单个关键词的KWS结果来实现类似AND查询的响应。此外,也有一些工作明确处理基于AND/OR词组合和词序列的查询。
以下是一个简单的表格,总结了单词查询和多词查询的相关情况:
| 查询类型 | 现有工作情况 | 实际应用需求 |
| ---
超级会员免费看
订阅专栏 解锁全文
359

被折叠的 条评论
为什么被折叠?



