本次介绍的论文
《Prototypical Networks for Few-shot Learning》
原型网络是解决小样本分类问题的一个比较实用且效果还不错的方法,这篇论文是在2016年NIPS上的一篇论文《Matching Networks for One Shot Learning》的基础上,进行了改进后而来的,改进后的方法简单且实用。本次将对这篇论文进行介绍和总结。
有关小样本学习是什么的介绍,请看上一篇博客浅述小样本学习以及元学习。
在小样本分类问题中,最需要解决的一个问题是数据的过拟合,由于数据过少,一般的分类算法会表现出过拟合的现象,从而导致分类结果与实际结果有较大的误差。为了减少因数据量过少而导致的过拟合的影响,可以使用基于度量的元学习方法,而原型网络便是。在此方法中,需要将样本投影到一个度量空间,且在这个空间中同类样本距离较近,异类样本的距离较远,如图:

在这个投影空间中,存在有三个类别的样本,且相同类别的样本间距离较近。为了给一个未标注样本x进行标注,则将样本x投影至这个空间并计算x距哪个类别较近,则认为x属于哪个类别。
那么,现在有几个问题:
- 怎么将这些样本投影至一个空间且让同类样本间距离较近?

本文介绍了原型网络作为小样本分类问题的解决方案,该方法源于2016年NIPS上的Matching Networks,并进行了改进。原型网络利用度量学习,通过投影样本到一个空间使得同类样本接近,异类样本远离。训练时,通过优化目标函数使样本到其类别原型的距离最小化。测试时,未标记样本被分配到最近的类别原型。尽管原理简单,但距离度量的合理性仍有待探讨。
最低0.47元/天 解锁文章
785

被折叠的 条评论
为什么被折叠?



