scene classification:bag of visual words,比如 restaurant 对应的 words:椅子,吧台,桌子等这些即为 visual words;
参数优化:
2. 深度学习方法
考虑到最终实现的效率问题:
使用 transfer learning,使用在 ImageNet 等大型数据集上已训练好的大型深度神经网络模型;也即 fine-tune a pre-trained model(transfer learning),使用转移学习对已训练好的模型进行 fine-tune 尤其适用于仅有中等规模的数据集(medium amounts of data),此外还有训练时间的考虑。自然,如果数据集规模很大,时间较为充沛,可考虑自己设计深度神经网络模型以及对本地数据进行训练;