4、手写文本识别与信息检索评估

最新推荐文章于 2025-10-07 23:20:54 发布

milk5

最新推荐文章于 2025-10-07 23:20:54 发布

阅读量26

点赞数

CC 4.0 BY-SA版权

分类专栏：手写文本的智能检索革命文章标签：手写文本识别 HTR 信息检索

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/milk5/article/details/152775667

手写文本的智能检索革命专栏收录该内容

38 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

手写文本识别与信息检索评估

1. 引言

在信息检索（IR）领域，有一个重要的概念是损失矩阵，如下表所示：
| 决策 \ 真实情况 | 不相关 | 相关 |
| — | — | — |
| 不相关 | $\lambda_{00}$ | $\lambda_{01}$ |
| 相关 | $\lambda_{10}$ | $\lambda_{11}$ |

其中，$\lambda_{10}$ 表示将实际相关的对象分类为不相关时所产生的损失。

2. 手写文本识别

对于文本图像中的文本信息检索，一种简单的方法是先使用手写文本识别（HTR）技术将图像转录为文本，然后使用现成的信息检索工具对这些可能存在噪声的自动转录文本进行处理。

2.1 HTR 的形式化问题

HTR 的目标是将数字化的文本图像自动转录为符号格式，以便进行文本编辑、索引和检索等操作。从形式上看，HTR 可以表述为以下模式识别（PR）问题：
给定一个图像区域 $x$，获取一个单词序列 $\hat{w}$，使得：
$\hat{w} = \arg \max_{w} P(w|x)$ (1.4)

从统计决策理论（DT）的角度来看，其潜在的损失函数 $\lambda_{ww’}$ 满足：当且仅当 $w = w’$ 时，$\lambda_{ww’} = 0$。因此，公式 (1.4) 是一个最小期望风险规则，旨在最小化整个转录错误的统计期望。

2.2 现代 HTR 方法

现代 HTR 方法基于光学模型和语言模型。光学模型处理如何将图像笔画解释为文本元素或字形

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。