Active learning 总结

本文探讨了Active Learning中选择信息性和代表性样本的重要性。通过QUIRE方法平衡这两种特性,旨在最小化所有样本的损失,包括已标记和未标记样本。文章还提到了SVM分类器、预聚类结合主动学习的策略,以及不同主动学习策略的比较,如不确定性采样、查询委员会和预期模型变化等。此外,还讨论了强化学习和半监督学习等相关领域。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Active learning by querying informative andrepresentative examples

PAMI 2014

本文主旨:将优化问题转换为在每一轮中选择的样本使得所有的样本损失最小,包括已标记样本和未标记样本。

Informative and representative :

Informative: 位于分类面边缘上的数据,比如说DNN paper中选取熵最大的数据。但是这样会带来一个问题,容易忽略数据原有的概率分布。特别是在小部分数据出现误检的时候,仅仅依靠离分类面远近是无法判断的。

Representative:寻找数据潜在的分布规律。通常利用聚类实现。不足之处在于,不能确定每类的label相同,同时不便于控制选择的数据量。

本文提出了一种新的方法,QUIRE,给出寻找informative 和representative 的衡量和折中。

 

 

QUIRE:

Query informative and representativeexamples

在新的一轮中,不论选中的x的label是什么,都会使得所有样本的损失最小。

SVM classifier

 

 

Active learning using pre-clustering

将clustering 和classification 结合起来,避免同一cluster中sample的重复标记。

方法局限于linear logistic regression. 本文目的仅仅为了说明clusteringinformation的优越性。

使用soft clustering membership, 允许一个sample以某一概率和多个cluster相连接。

两类分类问题

 

 

Active learning by learning

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值