论文简述
本文提出了原型网络,原型网络从数据中学习某种非线性的embedding,使得最终生成的度量空间中,每个类的点都聚集在单一的原型表示周围。对于询问点,只需要计算出在度量空间中距离最短的原型,并分类即可。
论文重点
想法
- idea : there exists an embedding in which points cluster around a single prototype representation ck for each class
- non-linear mapping to metric space using a neural network
算法
算法细节
思考
- 之所以不直接用softmax,而是进行硬聚集,应该是因为few-shot learning中所需要对应的种类较少,所以分类界限相交更为明显。而且训练数据量小,不能足够优化网络,直接用softmax容易产生过拟合现象,分类效果并不好,反而强行设定界限,会更有利于最终结果输出。
- github代码:https://github.com/jakesnell/prototypical-networks