Active learning Survey
主动学习的来世今生
主动学习的来世今生
核心思想:主动学习可以基于较少的已标注的数据量得到同样好的模型准确率。
在几乎所有的机器学习问题中,虽然未标注数据很丰富且易于获得,但是标注数据却很少或者需要大量的人工标注(成本问题)。所以主动学习是解决问题的核心方法之一。
这篇文章提供了一个主动学习详细的介绍和相关文献的总结。主要包括解决方案,查询策略框架,主动学习的分析,设置变量的问题,实际问题考虑,相关研究领域。
reference:
Burr Settles. Active Learning Literature Survey. Computer Sciences Technical
Report 1648, University of Wisconsin–Madison. 2009.
Burr Settles. Active Learning Literature Survey. Computer Sciences Technical
Report 1648, University of Wisconsin–Madison. 2009.
————————————
1.1 主动学习
主动学习,又称查询学习,最优实验设计,是机器学习的一个子领域。关键的假设前提是算法可以选择一部分数据去学习。
流程如下:
active learning vs passive learning:
2 解决方案
在文献中有三种主要的设想:成员查询合成,基于流的选择性抽样,基于池的抽样
具体差别如下: