自制数据集,解决本领域应用
目录
摘要
mnist_image_label 文件夹:
mnist_train_jpg_60000(训练集图片):
存放训练用的 60000 张图片,都是灰底白字的灰度图。
每张图有28行28列个像素点,每个像素点都是0到255之间的整数。
纯黑色用数值0表示,纯白色用数值255表示。
mnist_test_jpg_10000(训练集图片):
存放测试用的 10000 张图片,都是灰底白字的灰度图。
每张图有28行28列个像素点,每个像素点都是0到255之间的整数。
纯黑色用数值0表示,纯白色用数值255表示。
mnist_train_jpg_60000.txt(训练集标签):
存放60000张训练集图片的图片名和对应的标签,中间用空格隔开。
比如,28755_0.jpg 0 中 28755_0.jpg 就是训练集第一张图片的图片名,空格后的 0 是这张图所对应的标签。
mnist_test_jpg_10000.txt(训练集标签):
存放10000张测试集图片的图片名和对应的标签,中间用空格隔开。
比如,2028_7.jpg 7中 2028_7.jpg 就是训练集第一张图片的图片名,空格后的 7 是这张图所对应的标签。
图片文件夹:
标签文件:
一、Sequential() 实现自制数据集
"""
自制数据集,解决本领域应用
"""
# 导入模块
import os
import numpy as np
import tensorflow as tf
from PIL import Image
# 根目录
base_path = os.path.dirname(os.path.abspath(__file__))
# ../MNIST_FC/mnist_image_label/
base_path = os.path.join(base_path, "MNIST_FC")
base_path = os.path.join(base_path, "mnist_image_label")
# 训练集文件
train_path = os.path.join(base_path, "mnist_train_jpg_60000")
# 训练集标签
train_txt = os.path.join(base_path, "mnist_train_jpg_60000.txt")
# 训练集数据存储文件
x_train_save_path = os.path.join(base_path, "mnist_x_train.npy")
# 训练集标签存储文件
y_train_save_path = os.path.join(base_pa