一、赛题理解
1、赛题介绍
-
赛题名称:街景字符编码识别 / 街景门牌号码识别
-
赛事链接:https://tianchi.aliyun.com/competition/entrance/531795/introduction
-
数据集:
- 原数据集为SVHN街景门牌号码数据集, 链接:http://ufldl.stanford.edu/housenumbers/
-
比赛使用数据集:对SVHN进行匿名处理和噪音处理后的数据集
- 每张照片包括颜色图像和对应的编码类别和具体位置,训练集、验证集和测试集中标注了字符的位置框
- 所有的数据(训练集、验证集和测试集)的标注使用JSON格式,并使用文件名进行索引。如果一个文件中包括多个字符,则使用列表将字段进行组合。
-
数据集划分:
-
训练集:3W张照片,mchar_train.json,mchar_train文件夹
-
验证集:1W张照片,mchar_val.json,mchar_val文件夹
-
测试集A:4W张照片,mchar_test_a
-
测试集B:4W张照片
-
-
数据标签:训练和验证数据集中,图片中字符对应的编码标签和具体的字符框的位置
| Field | Description |
|---|---|
| top | 左上角坐标X |
| le |

本文深入探讨街景门牌号码识别的赛题,包括数据集介绍、评测标准和解题策略。赛题核心是分类问题,要求对图片中的不定长字符进行识别。简单入门方法是通过定长字符识别,专业方法则涉及CRNN模型和物体检测技术如SSD或YOLO。
最低0.47元/天 解锁文章
848

被折叠的 条评论
为什么被折叠?



