深度学习笔记(3)：1.3-1.7 建立你的目标(setting up your goal)

原创

于 2018-08-15 17:29:23 发布 · 486 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#单一值评价指标 #ML策略 #优化指标 #划分测试集开发集

1.3 单一值评价指标(single number evaluation matric)

这一节主要是说对于结果我们希望有一个单一评价指标来决定在多个模型中选择哪个，如下图所示：

建立机器学习项目的过程本来就是一个凭借经验不断更新迭代的过程。假设我们现在有两种方案A和B，A的查准率为95%，查全率为90%，而B的查准率为98%，查全率为85%。什么是查准率和查全率简单说一下，查准率就是准确率，即预测为猫的图片中真正的猫图片的概率，而查全率衡量的是图片是否查完全，查全率为预测正确的猫图片占全部猫图片的比例。

查准率和查全率是一种trade-off关系，比如为了提高查全率，我可以将所有的图片都预测为猫图片，这样查全率就是100%，因为所有真正的猫图片我都找到了，但是这样做就会让准确率很低。

面对图中AB两种方案，一个查全率高一些，一个查准率高一些，那么这两个方案我们到底该怎么选呢？这时候，我们就需要一个单一评价指标，比如F1 score，F1 score是查准率和查全率的调和平均数。计算得A方案的F1 score更大，所以选择一方案。

一般的机器学习项目我们都需要有开发集和单一评价指标。有了开发集，我们就可以计算对应的评价指标，然后再选取一个单一评价指标帮助我们快速地更新迭代产品。

再来看一个例子:

假设我们有一个猫app在全球几个地方投入使用，预测误差如上图所示。首先我们可以同时运行好几种方案，然后根据单一评价指标选择最优方案。在这里可以使用平均数，选取使全球多个地区平均误差最小的

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。