高级主动学习与不同机器学习任务的应用
1. 主动迁移学习的拓展阅读
在主动学习技术中,使用一种方法采样大量项目,再用另一种方法细化样本的高级技术相关研究较少。学术论文在结合不确定性采样和多样性采样时,多关注单一指标,但实践中可将两种方法链式使用,即先用一种方法获取大样本,再用另一种方法细化。学术论文常将组合指标与单个方法孤立比较,无法判断链式方法是否更优。
主动迁移学习方法比当前学术或行业论文报道的更先进。若对 ATLAS 将主动学习转化为机器学习问题本身感兴趣,可参考相关研究论文。例如 “Learning Active Learning from Data” 探讨了如何将机器学习应用于项目采样过程;“Optimistic Active Learning Using Mutual Information” 则研究了结合不确定性和代表性采样的方法。
主动学习策略总结如下:
- 结合不确定性采样和多样性采样有多种方式,可优化主动学习策略,提升模型标注样本的准确性。
- 结合不确定性采样和聚类是常见且易实现的主动学习技术,可作为探索高级策略的起点。
- 用于不确定性采样的主动迁移学习,能以现有模型为起点构建预测模型,判断未标注项能否正确标注。
- 用于代表性采样的主动迁移学习,可构建模型预测未标注项是否更接近目标领域。
- ATLAS 可扩展不确定性采样的主动迁移学习,避免在特征空间的某一区域过度采样,将不确定性和多样性采样结合为单一机器学习模型。
2. 主动学习在不同机器学习任务中的应用
之前的示例和算法主要聚焦文档级或图像级标签,而实际中更多复杂任务需应用主动学习,如计算机视觉中的对象检测
超级会员免费看
订阅专栏 解锁全文
1045

被折叠的 条评论
为什么被折叠?



