车牌识别
生活中车牌识别已经随处可见,那么,大家想知道车牌识别通过深度学习该如何实现嘛?现在,让我们通过百度飞桨paddlepaddle来实现一下吧
环境:paddlepaddle 1.7.0(用到动态图)
数据集: 百度ai数据集 车牌数据
推荐:白嫖百度ai V100显卡的算力(有一说一确实舒服)
前期工作
因为我们使用的是百度AI的环境,我们先对挂载的数据集进行解压缩
!rm -rf __MACOSX
!unzip -q /home/aistudio/data/data23617/characterData.zip
接下来我们导入需要的库
import numpy as np
import paddle as paddle
import paddle.fluid as fluid
from PIL import Image
import cv2
import matplotlib.pyplot as plt
import os
from multiprocessing import cpu_count
from paddle.fluid.dygraph import Pool2D,Conv2D
# from paddle.fluid.dygraph import FC
from paddle.fluid.dygraph import Linear
其中我们可以看到
from paddle.fluid.dygraph import FC被注释掉了
这是因为在paddlepaddle1.7.0中,动态图的FC被Linear所取代
至于如果使用静态图实现,则无所谓
静态图实现和动态图实现的区别
这里笔者多嘴一句个人感受,静态图使用起来导入数据方便,使用静态图也没有什么大碍,动态图调试起来方便,静态图和动态图之间各位仁者见仁智者见智就行
数据预处理
我们生成对应标签和图像地址的图像列表文件
# 生成车牌字符图像列表
data_path = '/home/aistudio/data'
character_folders = os.listdir(data_path)
label = 0
LABEL_temp = {
}
if(os.path.exists('./train_data.list')):
os.remove('./train_data.list')
if(os.path.exists('./test_data.list')):
os.remove('./test_data.list')
for character_folder in character_folders:
with open('./train_data.list', 'a') as f_train:
with open('./test_data.list', 'a') as f_test:
if character_folder == '.DS_Store' or character_folder == '.ipynb_checkpoints' or character_folder == 'data23617':
continue
print(character_folder + " " + str(label))
LABEL_temp[str(label)] = character_folder #存储一下标签的对应关系
character_imgs = os.listdir(os.path.join(data_path, character_folder))
for i in range(len(character_imgs)):
if i%10 == 0:
f_test.write(os.path.join(os.path.join(data_path, character_folder), character_imgs[i]) + "\t" + str(label) + '\n')
else:
f_train.write(os.path.join(os.path.join(data_path, character_folder), character_imgs[i]) + "\t" + str(label) + '\n')
label = label + 1
print('图像列表已生成')
定义一下数据reader
# 用上一步生成的图像列表定义车牌字符训练集和测试集的reader
def data_mapper(sample):
img, label = sample
img = paddle.dataset.image.load_image(file=img, is_color=False)
img = img.flatten().astype('float32') / 255.0
return img, label
def data_reader(data_list_path):
def reader():
with open(data_list_path, 'r') as f:
lines = f.readlines()
for line in lines:
img, label = line.split('\t')
yield img, int(label)
return paddle.reader