先上结果图,免得还没看就跑了
这是小程序显示的界面,上半部分通过调用手机摄像头,将图像传给后端算法,算法将识别结果,放回到这个页面黄色框这个部分。那么这个算法是怎么实现的呢。
图像分类算法
图像分类常用的卷积神经网络算是人工智能CV篇的入门
常用的算法比如lenet,多用于mnist和cifar10分类分别是28*28,和32*32尺寸的数据集。
然后vgg,resnet,mobilenet,efficientnet等分类算法大多以224*224的图像尺寸制作数据集。
本文就以最经典的resnet50算法为例子,教你如何制作图像分类的数据集,如何使用迁移学习resnet50进行训练模型,以及如何调用模型进行预测,代码都在下面,
多多点赞加关注,更新不间断。
首先是数据集的制作
我通过爬虫,爬取了5种水果,包含橘子、火龙果、苹果、草莓、香蕉等。每种几十张图片,各自放在相应的文件夹下,文件的命名后缀_train是训练集,_test是测试集
然后通过代码来生成数据集文本