基于相异性的多实例学习与形状类别学习的博弈论方法
在机器学习和计算机视觉领域,多实例学习(MIL)以及形状类别的无监督学习是重要的研究方向。本文将介绍基于相异性的多实例学习方法,以及一种通过博弈论方法来进行形状类别无监督学习的方案。
基于相异性的多实例学习
在图像检索数据集的实验中,使用线性核的支持向量机(SVM)以及Fisher方法,在三个数据集中的两个数据集上表现优于专门为MIL问题调整的SVM。这表明在这类问题中考虑实例之间的关系是有益的。
线性分类器基于所提出的相异性表示,在某些情况下比MIL文献中的最佳结果表现更好,在其余情况下接近已发表的最佳结果。需要注意的是,这些分类器是“现成”应用的,例如SVM中的权衡参数C没有通过交叉验证进行调整,而是固定为1。并且,分类器在维度等于训练样本数量的相异性空间中进行训练和测试。对于SVM来说这不是问题,对于Fisher方法则使用了伪逆。通过适当的正则化或降低相异性空间的维度,例如通过原型选择,可能会获得比表中报告的更好的结果。
SVM在某些图像检索数据集上的表现比随机表现还差,特别是在狐狸数据集上基于Hausdorff距离 $d_H$ 获得的相异性表示构建时。这可能是由于相异性空间中存在强烈的类别重叠。1NN和Fisher在这种表示上的表现也比其他表示差,这也证明了这一点。
最小点集距离 $d_{min}$ 作为包相异性度量效果很好。这有点令人惊讶,因为在MIL中由于正包也包含负实例,类别预计会重叠。原因是在使用的数据集中,正实例的分布比负实例更密集,因此包含至少一个正实例的包更有可能接近另一个包含至少一个正实例的包,而不是只包含负实例的包。
总的来说,相异性表示方法可以
超级会员免费看
订阅专栏 解锁全文
1679

被折叠的 条评论
为什么被折叠?



