吃瓜教程 task1

本文介绍了机器学习的基本概念,包括数据集、监督学习(分类和回归)、无监督学习(聚类),以及模型评估方法如留出法、交叉验证、性能度量(如P-R曲线、AUC和代价敏感错误率)。作者强调了泛化能力和选择合适模型的重要性,以及评估模型时考虑的复杂性与简洁原则。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第一章绪论

        这一章主要介绍了一些机器学习的一些基本概念,对机器学习有了更深入的了解。

        数据集(data set)、示例() or 样本(sample)、属性(attribute) 属性值(attribute value)、 

属性空间(attribute space) or 样本空间 or 输入空间:这三个是同一个意思,属性张成的空间。

机器学习主要分两类

监督学习 :主要有分类 和回归两种类型

无监督学习:聚类为代表,不需要标记信息,聚类:将训练集中的数据分成若干个组,每个组称为一簇(cluster

假设空间:可能拟合训练集的模型

版本空间:所有能够拟合训练集的模型构成的集合

泛化(generalization):训练得到的模型再新样本上面的预测能力的准确性,判断模型的好坏。

分布:假设样本服从一个D分布,然后通过足够多的样本来推测出D分布的信息,这就可以对新样本进行预测。这就很想一种经验学习,积累足够多的经验,来预测可能发生的事情。

奥卡姆剃刀(Occam‘s razor) :若有多个假设与观察一致,那就选择最简单的那个。

没有免费的午餐定理”(NFL)&#x

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值