深度学习之三：机器学习的策略

最新推荐文章于 2025-05-23 16:04:18 发布

原创

最新推荐文章于 2025-05-23 16:04:18 发布 · 3k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文为Andrew ng深度学习课程的第三部分，主要总结了机器学习的策略方法。

1 机器学习策略之一

当我们的模型搭建出来之后，策略可以指引我们为了达到目标，如何采取下一步行动。

1.1 正交化

当设计和训练一个监督学习的系统时，我们依赖下面四条正交的假定：

使模型在训练集上拟合，否则使用更大的神经网络或使用更好的优化算法。
使模型在开发集上拟合，否则使用正则化或使用更大的训练集
使模型在测试集上拟合，否则使用最大的开发集
使模型在现实中运行良好，否则重新规划开发集/测试集或调整损失函数

1.3 单一优化指标与决定性指标

在评估模型时，有时会有多个不同维度的评价参数。例如从算法角度有精确度，召回率。从应用角度上，算法可能对不同类型的客户或场景有不同的效果。

如果同时采用多个指标，就不能快速有效对比多个不同模型，可能会造成模型选择上的混乱。因此需要将不同标准归一化到单个量化评估指标，以方便比较不同模型。

另外的场景存在硬性指标要满足。比如在模型大小受限或运行时间受限的场景中，模型的大小或运行时间将成为接受模型的决定性因素。不满足这些条件的模型即使软性指标再好也无法接受。

1.4 训练/开发/测试集的分布

训练集/开发集/测试集的设置对大型团队的生产力影响十分巨大。

测试集是我们模型优化要瞄准的目标，因此强调开发集与测试集的数据要来自相同的分布，这样模型日常在开发集上的调优与测试集效果的目标是一致的，否则团队就会在模型优化与最终测试中南辕北辙，极大浪费团队时间。

1.5 改变开发集/测试或损失函数的情况

以一个推荐算法为例，假定有两个算法A，B。算法A以3%的错误率向用户推荐猫的图片，算法B以5%的错误率向用户推荐猫的图片。然而算法A却会向用户推荐黄色图片，而算法B却不会。从社会的层面算B是更合适的。

此种场景，说明损失函数定义是有问题的。需要调整损失函数，需要将损失函数定义为对黄色图片更敏感，通过对不同类图片增加权重以影响损失函数，例如增加黄色图片的权重：

E r r o r :

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。