人在回路机器学习入门与实践
1. 机器学习中的关键概念
在机器学习领域,有几个重要的概念值得深入探讨,它们对于构建有效的模型和理解数据至关重要。
1.1 预训练模型与迁移学习
预训练系统在处理大量数据时,无论使用何种语言,都倾向于放大文化偏见。预训练模型在执行任务时,仍然需要额外的人工标签才能取得准确的结果。因此,迁移学习虽然不能改变人在回路机器学习的整体架构,但它能在标注方面为我们提供显著的起点,影响我们用于采样额外数据项以供人工标注的主动学习策略的选择,甚至影响人类提供标注的界面设计。
迁移学习还是一些高级主动学习策略以及高级数据标注和增强策略的基础。
1.2 机器学习的知识象限
为了更好地理解机器学习中的各个主题如何相互关联,可以借助知识象限的概念。这个象限包含四个部分:
- 已知已知(Known knowns) :机器学习模型当前能够自信且准确完成的任务,代表模型的当前状态。
- 已知未知(Known unknowns) :模型目前无法自信完成的任务,可以对这些项目应用不确定性采样。
- 未知已知(Unknown knowns) :预训练模型中可适应于当前任务的知识,迁移学习使我们能够利用这些知识。
- 未知未知(Unknown unknowns) :模型知识中的空白,可以对这些项目应用多样性采样。
| 已知 |
|---|
超级会员免费看
订阅专栏 解锁全文
7

被折叠的 条评论
为什么被折叠?



