一. 研究背景
文字识别是CV领域应用最广,最接地气的方向之一,从证件识别到智慧医疗,从拍照识别到无人驾驶,从车牌识别到物流分拣,几乎涵盖了AI的所有场景。
通常文字识别分成两步,文本位置检测 + 识别。
> 论文参考:
> 常用数据集:
| 数据集名称 | 内容说明 | 下载 | 中英文 |
| ICDAR2011 | 2011, Localization,Recognition 2013, Localization, Segmentation, Recoginition. 2015/17, Localization, Recognition, End-to-end. 2017增加了中文检测识别RCTW |
【下载】 | 英文 |
| ICDAR2013 | 【下载】 | 英文 | |
| ICDAR2015 | 【下载】 | 英文 | |
| ICDAR2017 | 【下载】 | 中英文 | |
| COCO Text | 包含63,686张图片,但标注质量并不是太好。 |
【下载】 | 中英文 |
| MSRA-TD500 | 共500张自然场景图片,含倾斜图片 Training 300 + Test 200。 |
【下载】 | 中英文 |
| CTW |

本文介绍了OCR中的EAST算法,一种快速有效的场景文本检测方法,以及其简化分支、输出层和损失函数的设计。接着,文章提到了EAST的局限性和AdvancedEAST的改进,后者通过关注边缘像素提升检测准确性。
最低0.47元/天 解锁文章
4476

被折叠的 条评论
为什么被折叠?



