第十九届全国大学生智能汽车竞赛智慧交通组线上资格赛baseline

比赛介绍

在百度智慧交通赛项中,百度飞桨场景化地设计了基于深度学习的智能车趣味赛题,要求同学们在一套故事线中,使用飞桨完成特定场景的自动驾驶任务及系列自动化操作,赛题旨在在为创新人才的培养提供综合演练平台,拓宽高校人工智能相关专业的教学内容,提升高校科技创新能力。

OCR任务说明

这一次的智慧交通组的任务由以往的检测分割换成了OCR任务。OCR任务分为两种文字检测和文字识别,检测需要定位文本位置(类似目标检测),而识别就是识别出图像中的文字,我们这次的比赛任务就是文字识别。

基线选择

本项目仅仅为大家展示这次线上赛的基本流程,更多的是需要大家探索模型涨点的技巧。对于OCR任务,我们首推PaddleOCR工具包,PaddleOCR中集成了非常多的OCR算法可供大家选择!如果你想更加深入地了解PaddleOCR,可以去github上查看,链接在这:PaddleOCR

项目流程

那咱们话不多说直接开始吧!

1、数据集准备

我们首先需要解压数据,这里需要注意地是aistudio中数据最好放在data目录下,因为data目录下空间很大,放在其他地方会导致项目加载变慢。

In [ ]
#解压数据集
!unzip -d data/ data/data258841/DataForCompetitor.zip

我们先对数据集的基本情况看一下,先来看看图片

下面是标签

从标签的情况来看,数据集包含了英文、中文、字符等,本项目中我们使用了PaddleOCR自带的字典进行训练,当然大家可以根据数据集情况来定制化字典。 并且,数据集质量不是很高,图片分辨率很低很低,这就是一个需要解决的问题,大家可以开动脑筋。

数据集的一些Tips: (1) 大家要清楚地了解数据集的基本情况,包括图片质量,数据的分布。历年来看,最后高分选手都是对数据集进行了仔细地清洗。(2) 合成数据尽量少用,因为这个会导致结果无法重现。

2、克隆项目仓库

接下来我们克隆对应的项目仓库,注意,本项目一定要用PaddleOCR2.7才可以完成。另外,很多同学最后肯定会遇到文件过大问题,本项目对PaddleOCR进行了清洗删除了不必要部分,大家可以直接使用!

In [4]
#PPOCRv4目前只在github上面,注意不要clone错了
#目前项目里面已经上传最新的PaddleOCR
# !git clone https://github.com/PaddlePaddle/PaddleOCR
<span style="color:rgba(0, 0, 0, 0.85)"><span style="background-color:#ffffff">Cloning into 'PaddleOCR'...
^C
</span></span>
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

军哥说AI

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值