Here’s an interesting fact—Each month, there are 186.000 Google searches for the keyword “deep learning.”
大家好✨,这里是bio🦖。每月有超18万的人使用谷歌搜索深度学习这一关键词,是什么让人们对深度学习如此感兴趣?接下来请跟随我来揭开深度学习的神秘面纱。
一、深度学习介绍
深度学习是机器学习的一个领域,或者说子集(机器学习介绍),利用数学函数将输入映射到输出。数学函数能够从数据中提取非冗余信息或模式,这使得深度学习能够找到输入数据和输出数据之间的关系。也就是说深度学习能自动获取输入与结果之间的关系。
有些人认为深度学习系统的所有基本理论由弗朗克提出(Frank Rosenblatt),他在他的书中写道:“神经动力学原理:感知器和脑机制理论”(1962年)。1967年,Alexey Ivakhnenko和Lapa发表了第一个用于有监督的、深度的、前馈的、多层感知器的通用的、工作的学习算法。从1962年到1967年,从理论到实践,深度学习基本框架实现,如下图所示。

在本篇博客中,不会涉及到复杂的数学公式,对于初学者而言,复杂的数学公式是导致放弃的主要原因。甚至你可以是一个编程小白,你只要跟着本篇博客一步一步的实现,了解每个代码块在干什么,而不是了解代码的功能,你都能实现入门深度学习。
二、深度学习五步走
接下来将以Fashion Mnist 数据集代替手写数字数据集,向大家展示深度学习中的 Hello World。fashion mnist 数据集包含10分类群,共70000张灰度图像,以低分辨率(28x28 像素)展现。如下图所示:

2.1 数据准备
第一次导入数据时需要下载,稍稍等一会即可。该代码块的主要功能是引入需要的第三方库以及导入数据。
# import necessary package
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
# load data
fashion_mnist = tf.keras.datasets.fashion_mnist
(train_image, train_labels), (test_image, test_labels) = fashion_mnist.load_data()
导入的数据已经是经过处理后的图像数据,转变成了由数字组成的28*28维的矩阵,数字大小在0到255之间(如下图所示)。接下来的代码块主要是对训练集中任意一个样本进行可视化。可以看到训练集中的第九个样本是一只高跟鞋。
print(train_image[9])
# visualization one sample
image = train_image[9]
plt.figure()
plt.imshow(image)
plt.colorbar()
plt.grid(False)
plt.show()


接下看看数据格式,在下面的输出中可以看到训练集图像数据中包含6万个样本,每个样本由28*28维的矩阵构成。训练集标签数据包含6万个标签。
print(train_image.shape)
print(train_labels.shape)
# output
# (60000, 28, 28)
# (60000,)
标签从0到9分别对应在下列服饰名称。
class_names = ['T恤', '裤子', '套头衫', '裙子', '外套',

本文介绍了深度学习的基本概念,包括它在机器学习中的位置,以及其历史发展。通过FashionMNIST数据集,详细展示了如何进行数据预处理、定义和编译神经网络模型,以及训练和评估模型的过程。文章特别强调了模型在训练集和测试集上的表现差异,揭示了过拟合的概念。
最低0.47元/天 解锁文章
1794

被折叠的 条评论
为什么被折叠?



