图像文本信息提取技术全解析
1. 引言
数字图像和视频在多媒体数据文件中占比很大,其中蕴含着丰富的文本信息。这些文本信息能为图像内容提供有价值的语义描述,因此文本成为了图像中的感兴趣区域(RoI)。文本信息提取(TIE)旨在从数字图像和视频中提取相关的文本信息。TIE系统通常以图像或视频帧序列作为输入,这些输入可以是灰度或彩色、压缩或未压缩的,文本可以是静止或移动的。
然而,TIE面临诸多挑战,如图像的低对比度/分辨率、阴影或纹理背景、复杂背景、字体大小和样式的变化、艺术字体、颜色、任意文本布局、多脚本、不受控制的光照影响、反射、阴影以及透视投影导致的失真等,这些因素使得自动TIE变得极为困难。
2. 文本信息提取的应用
文本信息提取技术在多个领域有着广泛的应用:
- 车牌/集装箱板提取 :可自动提取和识别车辆车牌和集装箱板,助力交通监控和货物集装箱验证系统。
- 地址块提取 :用于从邮件中提取地址块。
- 网页搜索 :有助于网页的实体搜索和结构化搜索等高级搜索问题。
- 新闻文章搜索 :通过实体识别等标准信息提取帮助用户从新闻文章中找到特定信息。
- 页面分割 :为文档图像分析确定文档页面的格式。
- 情报信息检索 :从文档中识别和检索有关可疑犯罪元素的重要信息。
- 生物医学 :从大量科学出版物中搜索和提取与生物医学领域相
超级会员免费看
订阅专栏 解锁全文
3万+

被折叠的 条评论
为什么被折叠?



