基于相异性的多示例学习方法解析
在机器学习领域,多示例学习(MIL)是一个重要的研究方向。传统的监督学习中,每个对象由单个实例表示且有直接关联的标签,但在MIL里,复杂对象由一组“子对象”(实例)构成的集合(包)表示,只有包有标签,实例没有直接标签。下面我们深入探讨基于相异性的多示例学习方法。
多示例学习概述
MIL问题在很多实际场景中都有出现,比如医学图像分类。在这个场景下,一个病人的医学图像是一个包,图像中的局部图像块是实例,包的标签表示病人是否患病。传统解决MIL问题的方法有两种:
- 一种是在实例空间中明确学习一个决策边界,将捕获概念的实例与其他实例分开,然后根据包中是否有实例落在这个区域来对包进行分类。
- 另一种是将包中所有实例都标记为与包相同的标签,把问题当作标准的监督学习问题处理,最后通过组合包中各个实例的分类结果来对包进行分类。
然而,这些传统方法在学习步骤中独立处理同一包中的实例,忽略了潜在的有用信息。为了利用这些信息,一些研究者采用基于核的方法在包级别进行学习。例如,Andrews等人重新制定了支持向量机(SVM)优化问题,使其直接在包级别处理MIL问题;Gartner等人、Tao等人和Zhou等人则为MIL问题设计了专门的核,并使用标准SVM。
相异性表示学习
本文提出使用相异性表示方法来解决包级别的MIL问题。一旦构建了包的相异性空间,问题就转化为标准的监督学习问题,可以使用通用的监督分类器来解决。与基于核的方法不同,相异性表示方法不要求Mercer核,因此可以使用更广泛的接近度度量,如模式识别中常用的Hausdorff距离和单链接距离。
具体来说,对象通常用特征向量空间
基于相异性的多示例学习方法
超级会员免费看
订阅专栏 解锁全文
99

被折叠的 条评论
为什么被折叠?



