7、构建首个图像分类器：从数据处理到 k-NN 算法实践-优快云博客

本文链接：https://blog.youkuaiyun.com/b0c1d2/article/details/151630273

构建首个图像分类器：从数据处理到 k-NN 算法实践

在图像分类领域，构建一个有效的分类器需要经过多个关键步骤，包括数据集处理、图像预处理、选择合适的分类算法等。本文将详细介绍如何从基础开始，逐步构建一个简单的图像分类器，使用 k-Nearest Neighbors（k-NN）算法对动物图像进行分类。

1. 图像数据集处理

在处理图像数据集时，首先要考虑数据集的大小。数据集能否全部加载到机器的内存中，还是需要分块加载，这对于后续的处理至关重要。

1.1 “Animals” 数据集介绍

“Animals” 数据集是一个简单的示例数据集，包含狗、猫和熊猫三个类别，每个类别有 1000 张图像，总共 3000 张图像。狗和猫的图像来自 Kaggle Dogs vs. Cats 挑战，熊猫图像来自 ImageNet 数据集。该数据集较小，可以轻松加载到内存中，便于快速训练模型，无论是使用 CPU 还是 GPU 都能快速完成深度学习模型的训练。我们的目标是使用 k-NN 算法，仅基于原始像素强度来识别图像中的动物种类。

1.2 深度学习工具包项目结构

我们将构建一个自定义的深度学习工具包，从基本的辅助函数和类开始，逐步实现当前最先进的卷积神经网络。工具包的项目结构如下：

|--- pyimagesearch
|
|--- __init__.py
|
|--- datasets
|
|
|--- __init__.py
|
|
|--- simpledatasetloader.py
|
|--- preprocessing
|
|
|--