食品照片识别与空中书写识别技术研究
1. 食品照片识别系统概述
食品照片识别在饮食追踪系统中起着关键作用,它能够帮助人们更便捷地记录摄入的食物和营养信息。该系统主要包括食品图像识别、分量选择以及营养信息查询等环节。
- 食品图像识别 :系统构建了一个专门针对新加坡熟食中心食物的大型数据集,涵盖了 249 个食品类别,包含中国菜、西餐、印度菜、马来菜、小吃、水果、甜点和饮料等。除水果图像来自 ImageNet 数据集外,大部分图像通过 Google 图像搜索爬取。经过筛选,每个类别平均约有 300 张清晰图像,数据集总计 87,470 张图像。采用 ResNet - 50 进行食品识别,通过随机梯度下降法进行训练,并采用数据增强和 dropout 防止过拟合。
- 分量选择 :系统目前使用滑动条分量选择方法,覆盖约 60 种食物。通过示例食物照片将实际食物映射到具有分量大小照片的相似类型食物。
- 营养信息查询 :为确保营养信息的质量和覆盖范围,系统参考了多个数据库。首先是当地营养研究所的数据库,研究当地流行食物的营养;若食物未涵盖在此数据库中,则查询新加坡健康促进局的食物能量和营养成分数据库;对于一般食物,还使用 FatSecret API 作为参考。
2. 食品图像识别性能评估
2.1 实验数据与方法
- 数据集构建 :以食物名称为查询词从 Google 爬取图像,手动检查每个类别最多 1,300 张图像,排