12、提升图像分类准确率：从AlexNet到GoogLeNet的实践

异步汪仔

于 2025-11-11 16:21:17 发布

阅读量10

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习实战精讲文章标签： AlexNet GoogLeNet ResNet

本文链接：https://blog.youkuaiyun.com/d3e4f/article/details/154924914

深度学习实战精讲专栏收录该内容

18 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

提升图像分类准确率：从AlexNet到GoogLeNet的实践

在图像分类任务中，提高分类准确率是一个关键目标。本文将介绍如何在Kaggle的猫狗分类数据集上提升分类准确率，从使用AlexNet和10 - 裁剪过采样方法，到采用基于ResNet的迁移学习，最后深入探讨GoogLeNet架构及其Inception模块。

1. AlexNet与10 - 裁剪过采样方法

在评估AlexNet在Kaggle猫狗数据集上的性能时，最初测试集的准确率为92.60%。通过应用10 - 裁剪过采样方法，准确率提升到了94.00%，提高了1.4%。这种方法通过提取图像的特定区域（左上角、右上角、右下角、左下角以及对应的水平翻转），并将这些裁剪区域通过模型进行预测，最终取所有十个裁剪区域概率的平均值作为最终预测结果。

以下是展示过采样方法准确率的代码：

# compute the rank-1 accuracy
pbar.finish()
print("[INFO] predicting on test data (with crops)...")
(rank1, _) = rank5_accuracy(predictions, testGen.db["labels"])
print("[INFO] rank-1: {:.2f}%".format(rank1 * 100))
testGen.close()

要评估AlexNet，只需执行以下命令：