西瓜书1、2章笔记

第1章

机器学习可分为有监督学习和无监督学习。

有监督学习:分类、回归。分类表示的是一个离散值,比如一张图片是猫还是狗,而回归输出的是一个连续值,比如房价和天气预报的预测。

无监督学习:聚类,可简单理解为样本无标记信息。

第2章 模型评估与选择

学习器在训练集上的误差称为“训练误差”或者”经验误差“。

新样本上的误差则称为”泛化误差“。

过拟合:把训练样本本身一些特征认为所有样本都包含。

欠拟合:模型的表达能力不够,也就是训练样本的一些性质尚未学好。

评估方法有留出法、交叉验证法、自助法(有放回采样)

性能度量:衡量模型泛化能力的评价标准,回归任务常用的是均方误差。

错误率和精度:

错误率:分类错误的样本数占样本总数的比例。

精度:分类正确的样本数占样本总数的比例。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值