百度飞桨 猫狗分类例程 代码详细注释
paddle--->PaddlePaddle深度学习框架
os------------->python的模块,可使用该模块对操作系统进行操作
numpy---------->python第三方库,用于进行科学计算
PIL------------> Python Image Library,python第三方图像处理库
matplotlib----->python的绘图库 pyplot:matplotlib的绘图框架
os------------->提供了丰富的方法来处理文件和目录
sys------------->供对解释器使用或维护的一些变量的访问,以及与解释器强烈交互的函数。
pickle---------->模块实现了基本的数据序列和反序列化
# import python中导入语句,import 。。as。。。把xx重命名为as后面的单词
#from import 从xx中导入xx
# 导入需要的包
import paddle
import numpy as np
from PIL import Image
import sys
from multiprocessing import cpu_count
import matplotlib.pyplot as plt
import os
import sys
import pickle
print("本教程基于Paddle的版本号为:"+paddle.__version__)
#添加引用模块的地址
sys.path.append('/home/aistudio/external-libraries')```
```python
在这里插入代码片
1数据集介绍
使用CIFAR10数据集。CIFAR10数据集包含60,000张32x32的彩色图片,10个类别,每个类包含6,000张。其中50,000张图片作为训练集,10000张作为验证集。这次我们只对其中的猫和狗两类进行预测。
#解压数据集
!tar -zxvf /home/aistudio/data/data9154/cifar-10-python.tar.gz
#定义数据序列化函数
def unpickle(file):
with open(file, 'rb') as fo: ##rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。
dict = pickle.load(fo, encoding='bytes')
##方法实现的是将序列化的对象从文件file中读取出来。它的功能等同于 Unpickler(file).load()。
##pickle.loads(),参数如下:pickle.loads(bytes_object, *,fix_imports=True, encoding=”ASCII”. errors=”strict”)。pickle.loads()跟pickle.load()方法的区别:pickle.loads()方法是直接从bytes对象中读取序列化的信息,而非从文件中读取。
return dict
print(unpickle("cifar-10-batches-py/data_batch_1").keys())##解压文件
print(unpickle("cifar-10-batches-py/test_batch").keys())```
'''
自定义数据集
'''
from paddle.io import Dataset
class MyDataset(paddle.io.Dataset):
"""
步骤一:继承paddle.io.Dataset类
"""
def __init__(self, mode='train'):
"""
步骤二:实现构造函数,定义数据集大小
"""
super(MyDataset, self).__init__()
if mode == 'train':
xs=[]
ys=[]
self.data = []
self.label = []
#批量读入数据
for i in range(1,6):
train_dict=unpickle("cifar-10-batches-py/data_batch_%d" % (i,))
xs.append(train_dict[b'data'])
ys.append(train_dict[b'labels'])
#拼接数据
Xtr = np.concatenate(xs)
Ytr = np.concatenate(ys)
#数据归一化处理
for (x,y) in zip(Xtr,Ytr): ##zip函数把可迭代对象打包成一个元组
x= x.flatten().astype('float32')/255.0##numpy对象x降低到一维,默认是按照 行 来降维的
#将数据同一添加到data和label中
self.data.append(x)
self.label.append(np.array(y).astype('int64'))
else:
self.data = []
self.label = []
#读入数据
test_dict=unpickle("cifar-10-batches-py/test_batch")
X=test_dict[b'data']
Y=test_dict[b'labels']
for (x,y) in zip(X,Y):
#数据归一化处理
x= x.flatten().astype('float32')/255.0
#将数据同一添加到data和label中
self.data.append(x)
self.label.append(np.array(y).astype('int64'))
def __getitem__(self, index):
"""
步骤三:实现__getitem__方法,定义指定index时如何获取数据,并返回单条数据(训练数据,对应的标签)
"""
#返回单一数据和标签
data = self.data[index]
label = self.label[index]
#注:返回标签数据时必须是int64
return data, np.array(label, dtype='int64')
def __len__(self):
"""
步骤四:实现__len__方法,返回数据集总数目
"""
#返回数据总数
return len(self.data)
# 测试定义的数据集
train_dataset = MyDataset(mode='train')
eval_dataset = MyDataset(mode='val')
print('=============train_dataset =============')
#输出数据集的形状和标签
print(train_dataset.__getitem__(1)[0].shape,train_dataset.__getitem__(1)[1])
#输出数据集的长度
print(train_dataset.__len__())
print('=============eval_dataset =============')
#输出数据集的形状和标签
for data, label in eval_dataset:
print(data.shape, label)
break
#输出数据集的长度
print(eval_dataset.__len__())```
```python
在这里插入代码片
网络配置
class MyCNN(paddle.nn.Layer):
##定义卷积层,池化层,BN层,
def __init__(self):
super(MyCNN,self).__init__()
self.conv0 = paddle.nn.Conv2D(in_channels=3, out_channels=20, kernel_size=5, padding=0)
self.pool0 = paddle.nn.MaxPool2D(kernel_size =2, stride =2)
self._batch_norm_0 = paddle.nn.BatchNorm2D(num_features = 20)
self.conv1 = paddle.nn.Conv2D(in_channels=20, out_channels=50, kernel_size=5, padding=0)
self.pool1 = paddle.nn.MaxPool2D(kernel_size =2, stride =2)
self._batch_norm_1 = paddle.nn.BatchNorm2D(num_features = 50)
self.conv2 = paddle.nn.Conv2D(in_channels=50, out_channels=50, kernel_size=5, padding=0)
self.pool2 = paddle.nn.MaxPool2D(kernel_size =2, stride =2)
self.fc1 = paddle.nn.Linear(in_features=50, out_features=10)
def forward(self,input):
#将输入数据的样子该变成[1,3,32,32]
input = paddle.reshape(input,shape=[-1,3,32,32])##定义前向传播
x = self.conv0(input)
x = paddle.nn.functional.relu(x)##激活函数
x = self.pool0(x)
x = self._batch_norm_0(x)
x = self.conv1(x)
x = paddle.nn.functional.relu(x)
x = self.pool1(x)
x = self._batch_norm_1(x)
x = self.conv2(x)
x = paddle.nn.functional.relu(x)
x = self.pool2(x)
x = paddle.reshape(x, [x.shape[0], -1])
x = self.fc1(x)
y = paddle.nn.functional.softmax(x)
return y
###模型训练
#step3:训练模型
# 用Model封装模型
model = paddle.Model(MyCNN())
# 定义损失函数
model.prepare(paddle.optimizer.Adam(parameters=model.parameters()),paddle.nn.CrossEntropyLoss(),paddle.metric.Accuracy(topk=(1,5)))
# 训练可视化VisualDL工具的回调函数
visualdl = paddle.callbacks.VisualDL(log_dir='visualdl_log')
# 启动模型全流程训练
model.fit(train_dataset, # 训练数据集
eval_dataset, # 评估数据集
epochs=5, # 总的训练轮次
batch_size = 256, # 批次计算的样本量大小
shuffle=True, # 是否打乱样本集
verbose=1, # 日志展示格式
save_dir='./chk_points/', # 分阶段的训练模型存储路径
callbacks=[visualdl]) # 回调函数使用
#保存模型
model.save('model_save_dir')
def load_image(file):
#打开图片
im = Image.open(file)
#将图片调整为跟训练数据一样的大小 32*32,设定ANTIALIAS,即抗锯齿.resize是缩放
im = im.resize((32, 32), Image.ANTIALIAS)
#建立图片矩阵 类型为float32
im = np.array(im).astype(np.float32)
#矩阵转置
im = im.transpose((2, 0, 1))
#将像素值从【0-255】转换为【0-1】
im = im / 255.0
#print(im)
im = np.expand_dims(im, axis=0)
# 保持和之前输入image维度一致
print('im_shape的维度:',im.shape)
return im
#定义标签列表
label_list = [ "airplane", "automobile", "bird", "cat", "deer", "dog", "frog", "horse","ship", "truck"]
#读入测试图片并展示
infer_path='/home/aistudio/data/data7940/dog.png'
img = Image.open(infer_path)
plt.imshow(img)
plt.show()
#载入要预测的图片
infer_img = load_image(infer_path)
#将图片变为数组
infer_img=np.array(infer_img).astype('float32')
#进行预测
result = model.predict(infer_img)
输出预测结果
print('results',result)
print("infer results: %s" % label_list[np.argmax(result[0][0])])