零基础入门CV–街景字符识别(阿里天池学习赛)
比赛链接传送门:零基础入门CV - 街景字符编码识别-天池大赛-阿里云天池
1.简介
该比赛以SVHN街道字符为赛题数据,数据集报名后可见并可下载,该数据来自收集的SVHN街道字符,并进行了匿名采样处理,详细的介绍见赛事官网 。
首先看它们的数据组成以及特点,链接比赛里面的论坛的Task1-5是对这个比赛大致的讲解,大家可以先去看看。总的来说,train是3W张,val是1W张,test是4W张。里面都是数字,有1个,2个…6个数字组成,你要把它们识别出来,以准确率为衡量标准 。
我们要做的就是识别图片中的数字串,赛题给定的数据图片中不同图片中包含的字符数量不等
2.下载数据集
首先得报名,报了名才可以下载数据集。在这里下载
https://tianchi.aliyun.com/competition/entrance/531795/information,图片放不上来。就放网站吧。
网上说这个代码可以下载,不过我没试。
import pandas as pd
import os
import requests
import zipfile
import shutil
links = pd.read_csv('/content/mchar_data_list_0515.csv')
dir_name = 'NDataset'
mypath = '/content/'
if not os.path.exists(mypath + dir_name):
os.mkdir(mypath + dir_name)
for i,link in enumerate(links['link']):
file_name = links['file'][i]
print(file_name, '\t', link)
file_name = mypath + dir_name + '/' + file_name
if not os.path.exists(file_name):
response = requests.get(link, stream=True)
with open( file_name, 'wb') as f:
for chunk in response.iter_content(chunk_size=1024):
if chunk:
f.write(chunk)
zip_list = ['mchar_train', 'mchar_test_a', 'mchar_val']
for little_zip in zip_list

本文介绍了阿里云天池大赛的街景字符识别比赛,包括数据集下载、官方Baseline的使用及错误解决。参赛者需识别SVHN数据集中不同数量的数字串,提供的代码实现了数据下载、模型训练、验证和预测。通过调整官方Baseline,解决了运行时的类型错误问题,最终达到约0.52的准确率。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



