机器学习数据标注的劳动力与标注量估算
1. 保障工作与职业发展路径
在数据标注工作中,即便起初只需要兼职标注员,最终很可能还是希望有一些全职标注员。若存在成为全职员工的途径,应在任务描述中提及,以吸引优秀人才。
不过,要基于个人绩效来规划全职工作的可能性,而非营造竞争环境。例如,不要说“表现最好的 10 人将获得 3 个月的合同”,而应说“达到 X 工作量且准确率为 Y 的人将获得 3 个月的合同”。若无法做出承诺,就不要轻易许诺,以免无意中形成剥削性环境。
若市场提供反馈和评价,要充分利用。工作出色的人理应得到认可,这有助于他们未来的工作和职业发展。
2. 其他劳动力类型
除了内部员工、外包员工和众包员工这三种常见的劳动力类型,还有其他类型的劳动力可供选择。
2.1 直接签约个人
对于小型公司,直接与个人签约往往比使用外包公司更成功。一些在线合同标注员市场能让你了解某人过去的工作情况,直接与他们合作更易确保公平支付和开放沟通。但这种方式并非总能大规模应用,不过对于一次性的小型标注项目可能很有效。
2.2 其他劳动力
还可以考虑以下几种劳动力:
- 终端用户 :若能从终端用户那里免费获取数据标签,这将是一种强大的商业模式。许多应用中,用户的反馈可驱动机器学习模型,如搜索引擎,用户从搜索结果中的选择能帮助其在未来更好地匹配类似查询。然而,大多数能从终端用户获取数据的系统仍会花费大量时间离线标注相同数据。
用户提供的训练数据存在的最大问题是,用户会主导采样策略,可能导致数据缺乏多样性。若仅采样当天用户感兴趣
机器学习数据标注策略与估算
超级会员免费看
订阅专栏 解锁全文

34

被折叠的 条评论
为什么被折叠?



