食品图像数据集的自动扩展
1. 研究背景与目标
在食品识别领域,现有的工作存在一些局限性。以往的食品数据集主要针对特定国家常见的食物,如美国食品、中国食品和日本食品等,且目标食品类别数量最多限制在 100 个。然而,从实际应用角度来看,人们日常生活中食用的食物种类远不止 100 种,因此需要增加可识别的食品类别数量。为了便于添加食品类别并实现适用于其他国家或所有国家食品的图像识别系统,提出了一种利用现有食品数据集通过迁移学习自动构建额外或新的食品数据集的方法。
2. 相关工作
- 网络图像收集与处理 :网络上有大量各种类型的图像,可通过 Web API(如 Bing Image Search API、Flickr API 和 Twitter API)轻松收集与给定关键字相关的图像。但原始网络图像包含许多与关键字无关的噪声图像,因此过去十年提出了许多对网络图像进行重新排序的方法,大多采用目标识别方法从网络收集的“原始”图像中选择相关图像。
- 众包平台的应用 :亚马逊机械 Turk(AMT)是全球最大的众包网络平台,常用于选择相关图像的任务。它可以帮助构建大规模图像数据集(如 ImageNet)、带有边界框的中大型数据集,以及为大规模数据集添加属性。在一些工作中,AMT 被纳入目标识别程序,如 Vijayanarasimhan 等人将目标检测器的主动学习与 AMT 众包任务相结合,逐步提高目标检测的准确性;Branson 等人则通过给 AMT 工人简单的问题,将 AMT 与目标分类器互补使用,以处理困难的细粒度目标分类。此外,由于众包的应用,还发布了许多用于细粒度视觉分类研究的图像数据
超级会员免费看
订阅专栏 解锁全文


被折叠的 条评论
为什么被折叠?



