吴恩达机器学习笔记week11——机器学习系统设计 Machine learning system design

本文探讨了机器学习系统设计中的关键步骤,包括确定工作优先级、误差分析、不对称分类误差评估、精确度与召回率之间的权衡,以及如何选择合适的机器学习数据。通过这些内容,帮助读者理解如何构建高效且实用的机器学习系统。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

11-1.确定执行的优先级 Prioritizing what to work on: Spam classification example

在这里插入图片描述
在这里插入图片描述

11-2.误差分析 Error analysis

判断应采取哪种手段降低错误率的方法:
在这里插入图片描述
波特词干器(Porter Stemmer):后缀剥离的词干提取算法
数值评价指标:number evaluation metrics
最好在交叉验证集上做误差分析,不要在测试集上

11-3.不对称性分类的误差评估 Error metrics for skewed classes——Precision/Recall 查准率/召回率

sknewed classed : 正样本数量和负样本数量相差很大
在这里插入图片描述
用y=1表示比较稀少的一类
Precision/Recall 查准率/召回率越高越好
high precision is a better thing.

11-4.精确度和召回率的权衡 Trading off precision and recall

改变threshold
precision :更加精确,尽量减少误判假为真,只要有一点点不可能是癌症就判为不是癌症,阈值大
recall :尽量减少误判真为假,只要有一点点可能是癌症就判为癌症,阈值小
在这里插入图片描述
在这里插入图片描述

11-5.机器学习数据 Data for machine learning

在这里插入图片描述
在这里插入图片描述

参数多---->低偏差
训练集大----->低方差

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值