以人为中心的人工智能:主动学习与数据标注
1 人机协作机器学习基础
人机协作机器学习是一种将人类智慧融入机器学习过程的方法,旨在提高机器学习系统的性能和效率。其基本原理在于结合人类的判断力和机器的计算能力,以解决复杂的问题。
1.1 人机协作机器学习基本原理
人机协作机器学习的核心是让人类参与到机器学习的各个环节中,包括数据标注、模型训练和评估等。通过人类的参与,可以弥补机器在某些方面的不足,例如对复杂语义的理解和判断。
1.2 数据标注介绍
数据标注是人机协作机器学习中的重要环节,它为模型提供了有标签的训练数据。标注策略可以分为简单和复杂两种类型。简单标注策略通常适用于数据特征明显、标注任务明确的情况;而复杂标注策略则需要更多的专业知识和判断,例如对图像中的物体进行精细分类。
数据标注面临的挑战包括:
- 数据科学知识差距 :标注人员可能缺乏必要的数据科学知识,导致标注结果不准确。
- 高质量标注困难 :保证标注的质量需要耗费大量的时间和精力,而且标注结果可能受到主观因素的影响。
1.3 主动学习介绍
主动学习是一种通过选择最有价值的数据进行标注,从而提高训练效率和降低成本的方法。主动学习的采样策略主要包括不确定性采样、多样性采样和随机采样。
- 不确定性采样 :选择模型最不确定的样本进行标注,以帮助模型更快地学习。
- 多样性采样 :选择具有代表性的样本进行标注,以确保模型能够
超级会员免费看
订阅专栏 解锁全文
440

被折叠的 条评论
为什么被折叠?



