人机协作机器学习入门与实践
1. 人机协作机器学习概述
在人机协作机器学习中,预训练系统虽然强大,但存在放大文化偏见的倾向。并且,预训练模型仍需额外的人工标注才能在任务中取得准确结果,不过迁移学习能在标注方面为我们提供显著的先发优势,这会影响主动学习策略的选择以及人工标注的界面设计。
1.1 机器学习知识象限
为了更好地理解机器学习中的各种概念和任务,可以借助知识象限来进行分析,具体如下:
| | 已知 | 未知 |
| — | — | — |
| 已知 | 模型能自信且准确完成的任务(已知已知),代表模型当前状态 | 模型当前不能自信完成的任务(已知未知),可应用不确定性采样 |
| 未知 | 预训练模型中可适配到当前任务的知识(未知已知),可通过迁移学习利用 | 模型知识的缺口(未知未知),可应用多样性采样 |
这个知识象限的行和列也有其特定含义:
- 上一行表示模型自身的知识。
- 下一行表示模型之外的知识。
- 左列的问题可通过合适的算法解决。
- 右列的问题可通过人机交互解决。
1.2 人机协作机器学习架构总结
- 人机协作机器学习的整体架构是一个结合人类和机器组件的迭代过程。
- 可以使用一些基本的标注技术来创建训练数据,确保标注准确高效。
- 两种常见的主动学习策略是不确定性采样和多样性采样,理解它们的基本原理有助于为特定问题制定合适的策略。
- 人机交互为设计人机协作机器学习
超级会员免费看
订阅专栏 解锁全文
980

被折叠的 条评论
为什么被折叠?



