Machine Learning Yearning 33-35 阅读笔记:和人类水平进行比较

本文探讨了在机器学习任务中与人类水平进行比较的重要性,包括如何定义人类的表现水平及超越人类表现的方法。通过选择合适的基准,可以有效指导算法的优化方向。

33.为什么我们和人类水平比较

当你试图做一项人类可以很好完成的任务时,比较容易构建机器学习系统
1.容易获得label 2.可以由人的直觉进行错误分析 3.用人类水平估计最优错误率并设置期望错误率
而对于一些人类都不能很好胜任的任务,例如推荐和预测,那么会有以下问题:
1.难以获得标签 2.人类直觉不起作用,很难提升算法 3.很难知道最佳错误率和合理的期望错误率

34.如何定义人类的表现水平

假设没有医学背景的人在X光图像诊断上能达到15%错误率,初级医生能达到10%,有经验的能达到5%,医生小组讨论能达到2%,那么该选哪一个作为人类水平呢?我(吴恩达)会选择2%作为最优错误率,因为上一章中与人类水平比较的三个原因均适用。
当你标注数据的时候,由于整个小组的医生的时间很宝贵,那么你在绝大多数情况下拥有一个初级医生的标签,并只给有经验或一组医生更难的图像。
当你的系统当前错误率为40%那么谁来标注数据并不重要,但当错误率降到10%,那么定义人类水平未2%就能更好的改进你的系统。

35.超越人类表现

如果你进行语音识别,即使是人类在数据集上也有8%的错误,假设你的系统已经错误率降到8%,那么如何取得快速的进展呢?
尝试挑出一个子集,人类能显著超越系统,如快语速的子集,那么你仍能用33章的知识推动进展,33章的3点都能适用于这个子集。
在很多问题上,机器已经超越了人类,如预测电影评级,货车驾驶用时,信贷。一旦人类很难识别算法判断错的样例,那么这时挑子集的方法就有用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值