Extremal Region(极值区域)文本定位与识别法-学习笔记(二)

本文是关于提高复杂场景文本识别率的学习笔记,关注实时场景文本定位与识别。介绍极值区域(ER)的概念,它是图像处理中的一种技术,用于文本检测。通过理解ER的数学定义及其在RGB、HIS和强度梯度通道的应用,探讨如何选择合适的通道组合以平衡运行时间和定位效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  最近做一个计算机视觉的项目,要将其中复杂场景中的文本识别率从92%进一步提升,挑战很大也很有意思。边阅读一些最新的文本定位与识别的论文,边在这里记下阅读笔记与翻译内容,慢慢研究。本人英语与专业水平有限,仅供学习参考,欢迎交流,请多指教。

Reference: Real-TimeScene Text Localization and Recognition  Luk´aˇs Neumann  Jiˇr´ı Matas 2012 IEEE


Extremal Regions

下面是一些用到的基本数学概念(有些枯燥):

将一幅图像I视为一种映射

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值