用于食物图像识别的深度卷积网络
1. 引言
食物在我们的日常生活中至关重要,它为身体提供必要的营养和能量,以维持免疫系统健康、修复细胞和组织等基本功能。然而,不健康的饮食习惯可能导致肥胖、糖尿病和高胆固醇血症等慢性疾病。据世界卫生组织(WHO)统计,1980 年至 2014 年间,全球肥胖率翻了一番多,13%的人肥胖,39%的成年人超重,肥胖还可能引发骨关节炎、哮喘、癌症等多种疾病。因此,准确评估食物摄入量对于降低慢性疾病风险至关重要,这就需要一个高精度且优化的食物图像识别系统。
食物图像识别是一个复杂的问题,吸引了科学界的广泛关注。早期的方法包括 Fisher Vector,它利用 Fisher 核在局部层面分析食物图像的视觉特征;还有袋状视觉词(BOW)表示法,通过对图像块的仿射不变描述符进行向量量化。此外,Matsuda 等人提出了一种综合方法,结合多种技术识别和分类图像中的食物。Bossard 等人引入了 Food - 101 基准数据集,并提出随机森林挖掘方法。
随着计算机视觉、机器学习和处理速度的进步,深度学习算法,尤其是卷积神经网络(CNN),因其稀疏交互、参数共享和等变表示等独特属性,在食物图像分类中得到广泛应用。许多研究使用预训练模型(如 AlexNet 和 EfficientNetB0)或开发新的深度 CNN 算法,在不同数据集上取得了不错的准确率。但仍有改进空间,本文旨在提出一种高精度、优化的食物图像识别模型——FRCNN。
2. CNN 架构
卷积神经网络(CNNs)是一种深度人工神经网络,用于处理网格模式输入(如图像)的目标检测和识别任务。它与人工神经网络(ANNs)结构相似,采用前馈架构,将节点分为不同层,输
超级会员免费看
订阅专栏 解锁全文
1914

被折叠的 条评论
为什么被折叠?



