引言: 这篇博客主要介绍的是表示学习(representation learning),在此基础上,研究了Circle loss这篇CVPR文章。感觉所谓的半监督,目前,在图像分类领域作用寥寥,图数据已经与图像这类数据不是一个类别了。
表示学习(Representation learning)以及相关(半监督)论文阅读
1. 表示学习
机器学习算法的成功与否不仅仅取决于算法本身,也取决于数据的表示。数据的不同表示可能会导致有效信息的隐藏或是曝露,这也决定了算法是不是能直截了当地解决问题。
PS: 感觉他这个有点像意思是现在一些文章,往往先做了信号处理(比如连续小波变换,CWT),然后输入到深度学习模型中去。信号处理实际上就是做了表示学习的工作,在获得了能够足够区分不同类别差异性的特征后,再去用深度学习构建模型实现分类等功能。
补充说明:
- 对复杂的原始数据化繁为简,把原始数据的无效信息剔除,把有效信息更有效地进行提炼,形成特征,这也应和了机器学习的一大任务——可解释性
- 稍微入门后的机器学习者们应该都知道,传统的Machine learning做法都人为地设计特征或者说使用已经完全标记好的数据来试图接近最好的分类效果。但实际上很多未标记的或者说标记相对较少的训练数据