【深度学习-图像识别】使用fastai对Caltech101数据集进行图像多分类（50行以内的代码就可达到很高准确率）

原创

已于 2023-08-21 08:51:56 修改 · 2.3k 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #分类 #人工智能

于 2023-08-19 15:38:36 首次发布

本文介绍了如何使用fastai库和预训练的ResNet101模型对Caltech101数据集进行图像分类，通过快速的数据处理、模型训练和调优，实现高准确率的图像识别，展示了其易用性和效率。

文章目录

前言
- fastai介绍
- - 数据集介绍
一、环境准备
二、数据集处理
总结
- - 人工智能-图像识别系列文章目录

前言

fastai介绍

fastai 是一个深度学习库，它为从业人员提供了高级组件，可以快速、轻松地在标准深度学习领域提供最先进的结果，并为研究人员提供了低级组件，可以混合和匹配以构建新的方法。以解耦抽象的方式表达了许多深度学习和数据处理技术的通用底层模式。
fastai 有两个主要的设计目标：易于使用、快速高效，同时具有很强的可破解性和可配置性。它建立在提供可组合构件的低级应用程序接口的层次结构之上。这样，如果用户想重写部分高级应用程序接口或添加特定行为以满足自己的需求，就不必学习如何使用最底层的应用程序接口。
在这里插入图片描述

数据集介绍

下载链接
Caltech101国内下载地址
 Caltech101

Caltech101数据集内部有 101 个类别的物体图片。每个类别约有 40 至 800 张图片。大多数类别约有 50 张图片。每张图片的大小大约为 300 x 200 像素。并且作者还标注了这些图片中每个物体的轮廓，这些都包含在 "Annotations.tar "中。还有一个 MATLAB 脚本 "show_annotations.m "可以查看注释。

Collected in September 2003 by Fei-Fei Li, Marco Andreetto, and
Marc’Aurelio Ranzato。

一、环境准备

这里展示使用GPU进行训练的环境搭建，只用CPU也可以进行训练，只是训练时间比较慢。
首先安装Anaconda，通过conda安装我们需要的包

 conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
 conda install -c nvidia fastai anaconda

详情可见第一篇文章。

二、数据集处理

1.数据目录结构

├───data_iamge
│   ├───101_ObjectCategories
│   │   ├───accordion
│   │   ├───airplanes
│   │   ├───anchor
│   │   ├───ant
│   │   ├───BACKGROUND_Google
│   │   ├───barrel
│   │   ├───bass
│   │   ├───beaver
│   │   ├───binocular
│   │   ├───bonsai
│   │   ├───brain
│   │   ├───brontosaurus
...

2.导入依赖项

from fastai import *
from fastai.vision.all import *
from fastai.metrics import error_rate

import os
#from keras.utils import plot_model
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt