卷积神经网络深度学习入门与实践
1. 卷积神经网络概述与数据集
卷积神经网络(CNN)在图像识别领域取得了巨大成功,也被广泛应用于其他众多领域。在构建神经网络时,除了之前了解的全连接(FC)层和激活层,现在我们将引入卷积层、最大池化层和扁平化层。这些新层可以按照我们期望的任何架构添加,数据科学家们也在不断尝试不同的架构以获得最佳的预测和分类效果。
我们使用的数据集来自MNIST(Modified National Institute of Standards and Technology)数据库,它是一个大型的手写数字数据库,包含60,000张训练图像和10,000张测试图像,常用于训练各种图像处理算法和机器学习模型。这些图像是28×28像素的黑白灰度图像。
| 数据集 | 数量 |
|---|---|
| 训练图像 | 60,000 |
| 测试图像 | 10,000 |
2. 图像转换为输入
早期的图像识别尝试将图像表示为数组,对于灰度图像,可构建与图像像素维度相同的数组,每个元素的值范围为0 - 255,值越大像素越亮,0表示黑色。然后将这个数组“展开”成一个向量作为神经网络的输入。然而,这种方法的缺点是没有考虑相邻输入之间的关系,而图像数据实际上存在一定的内部关系。
CNN的核心思想是利用相邻输入之间的关系。具体做法是创
超级会员免费看
订阅专栏 解锁全文
879

被折叠的 条评论
为什么被折叠?



