Active learning Survey
主动学习的来世今生
主动学习的来世今生
核心思想:主动学习可以基于较少的已标注的数据量得到同样好的模型准确率。
在几乎所有的机器学习问题中,虽然未标注数据很丰富且易于获得,但是标注数据却很少或者需要大量的人工标注(成本问题)。所以主动学习是解决问题的核心方法之一。
这篇文章提供了一个主动学习详细的介绍和相关文献的总结。主要包括解决方案,查询策略框架,主动学习的分析,设置变量的问题,实际问题考虑,相关研究领域。
reference:
Burr Settles. Active Learning Literature Survey. Computer Sciences Technical
Report 1648, University of Wisconsin–Madison. 2009.
Burr Settles. Active Learning Literature Survey. Computer Sciences Technical
Report 1648, University of Wisconsin–Madison. 2009.
————————————
1.1 主动学习
主动学习,又称查询学习,最优实验设计,是机器学习的一个子领域。关键的假设前提是算法可以选择一部分数据去学习。
流程如下:

active learning vs passive learning:

2 解决方案
在文献中有三种主要的设想:成员查询合成,基于流的选择性抽样,基于池的抽样
具体差别如下:

本文对比了主动学习与被动学习的差异,重点关注不确定性抽样策略,包括最小自信度、边际抽样和香农熵抽样。香农熵抽样虽然在某些特定情况表现稍逊,但其信息提取能力最为广泛。文章探讨了这些方法在分类和回归问题中的应用,并提出如何处理中文文本以进行不确定性抽样分析的挑战。
最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



