74、多实例学习中的类依赖相异度度量

多实例学习中的类依赖相异度度量

1. 引言

多实例学习(MIL)是对传统监督学习方法的扩展,它从由一组特征向量(实例)描述的对象中进行学习,而不是仅基于单个特征向量。MIL 问题常被视为二分类问题,即实例集合(包)可属于正类或负类。包的标签已知,但单个实例的标签未定义。传统的 MIL 问题假设正包包含一个或多个来自所谓“概念”的正实例,而负包仅包含负实例。

例如,在将由图像片段集合表示的图像分类为“老虎”或“无老虎”时,包含黑色条纹的片段可视为“老虎”概念的正实例,而包含草地、天空等的片段则被视为负实例或背景实例。

传统的 MIL 方法主要分为两类:
- “基于实例”的方法:试图通过识别包中“最正”的实例来建模概念,并在新包中存在该概念内的实例时将其分类为正包。
- “基于包”的方法:直接比较包,使用距离、核或相异度。可以定义包之间的相异度度量,用包与其他包的相异度表示每个包,并将这些相异度值作为监督分类器的特征。

然而,基于实例的方法明确利用了正包与负包不同的假设,而基于包的方法通常不区分类别。这在 MIL 问题中可能不太自然,因为我们知道正包和负包的差异。因此,本文探讨了类依赖相异度度量在 MIL 问题中的合理性。

2. 相关工作

使用类依赖距离度量并非新思路。例如,二次判别分析允许不同类具有不同的协方差矩阵。还有研究致力于为每个特征/类组合学习权重,并将这些权重用于马氏型度量,以提高语音识别等任务的性能。也有研究提出为不同类学习不同的度量,从而改善分类结果。

除了类依赖距离,还有研究关注类依赖特征。例如,在文档分类的词袋方法中,基于特定类中频繁出现的词来表示文档可能比基于

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值