基于卷积神经网络的图像分类实战
1. 图像分类概述
图像分类是计算机视觉的一个重要分支,起源于20世纪60年代。如今,计算机在图像分类方面的智能已经超越了人类,例如城市交通信号灯旁的智能摄像头可以读取行驶车辆的车牌,手机能够识别用户的面部。图像分类在自动驾驶汽车、生物医学诊断系统等众多领域都有广泛应用。
我们可以借助人工智能理论、更强大的计算机硬件以及大量免费的数据集来实现图像分类。本文将使用MNIST、CIFAR - 10和蔬菜图像这三个数据集来训练图像分类算法或模型。这些数据集都带有标签,可用于监督学习,就像给三岁孩子看动物图片并告诉他们“那是狗,那是猫,那是鸟”一样,通过这些带标签的图片训练孩子的大脑,之后带孩子到外面看真实的动物并多次询问“那只动物叫什么名字”,孩子回答的正确率就是衡量其训练效果的基准。同样,用图像数据集训练图像分类模型后,模型就可以预测数据集中的照片上是否有猫、狗、鸟或数字“5”等。训练良好的模型可能有上百万个参数,这些参数和模型结构可以保存并写入集成电路(IC)芯片,用于特定应用。
2. MNIST数据库手写数字分类
2.1 MNIST数据集介绍
MNIST(Modified National Institute of Standards and Technology)是计算机视觉领域最著名的数据库,常被用作测试机器学习算法的基准。需要注意的是,MNIST数据集是一个非常简单的数据集,即使是具有两个全连接神经网络层的模型也能达到98%的准确率。但在MNIST上表现良好的模型并不意味着在其他数据集上也能有好的表现,它通常作为测试和开发机器学习模型的起点。
MNIST数据集分为训练集和测试
卷积神经网络图像分类实战
超级会员免费看
订阅专栏 解锁全文
897

被折叠的 条评论
为什么被折叠?



