《Machine Learning Yearning》第18章

本文探讨了算法开发中Eyeball开发集的理想规模,指出其大小应足以揭示算法的主要错误类型。文章提供了根据分类器错误数量评估开发集大小的指导原则,强调了足够的错误样本对于理解算法性能的重要性。

#18 How big should the Eyeball and Blackbox dev sets be?
这里写图片描述

你的Eyeball开发集应该要足够大,以至于能得到你算法的主要错误类别。如果正在做一项人类做的好的工作(例如识别图片中的猫),下面有一些粗略的指引:

  • 一个Eyeball开发集在你的分类器里有10个错误,这被认为是非常小的。只有10个错误,很难准备估计不同错误类别的影响。但是如果你的数据非常少并且Eyeball开发集也无法承担更多的数据,那么这比没有好,并且有助于项目的优先级排序。
  • 如果你的分类器在Eyeball开发集样本中有20的错误,你可以粗略的估计主要错误来源。
  • 如果有50个错误,你可能对主要错误来源有较好的了解。
  • 有100个错误,你将非常了解错误的主要来源。我看到人们手动分析更多的错误–有时多达500个。只要你有足够的数据,就没有任何坏处。

假设你的分类器有5%的错误率。为了确保你的Eyeball开发集有100的错误标记的样本,Eyeball开发集就必须有大约2000个样本(因为0.05*2000=100)。你分类器错误率越低,你的Eyeball开发集就要越大,以便获得足够多的错误去分析。

如果你正在做连人类都做不好的任务,那么检查Eyeball开发集将不会有什么用处,因为很难弄清楚为什么算法没有对一个样本正确分类。在这种情况下,你可能会不设置Eyeball开发集。我们将在后面的章节讨论这种问题的处理方式。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值