最近做一个计算机视觉的项目,要将其中复杂场景中的文本识别率从92%进一步提升,挑战很大也很有意思。边阅读一些最新的文本定位与识别的论文,边在这里记下阅读笔记与翻译内容,慢慢研究。本人英语与专业水平有限,仅供学习参考,欢迎交流,请多指教。
Reference: Real-TimeScene Text Localization and Recognition Luk´aˇs Neumann Jiˇr´ı Matas 2012 IEEE
Extremal Regions
下面是一些用到的基本数学概念(有些枯燥):
将一幅图像I视为一种映射