机器学习——西瓜书(DAY1)

1.初学机器学习的第一本书:通读、速读;(计划一天至少20页)

7.24日

第一章绪论

1.1引言

机器学习所研究的主要内容是关于再计算机上从数据中产生“模型”的算法,即“学习算法”。

1.2基本术语

数据集(data set)

样本(sample)

特征(feature)

样本空间(sample space)

从数据中学得模型的过程成为“学习(learning)或者训练(training)”,这个过程通过执行某个学习算法来完成。训练过程中使用的数据称为“训练数据”(training data),其中每个样本称为“训练样本”(training sample),训练样本组成的集合成为训练集(training set)。学得的模型对应了关于数据的某种潜在的规律,也成为“假设"(hypothesis),这种潜在的规律自身,成为”真相“(ground-truth),学习过程就算为了找出或者逼近真相,模型也被成为”学习器“(learner)

预测(prediction)

示例结果”:标记 (label)

预测离散值——分类(classification)

                        ——“二分类”(binary classification)

                        ——“多分类"(multi-class classification)

预测连续值——回归(regression)

根据训练数据是否具有标记信息——”监督学习“(supervised learning)--分类回归

                                                  ——”无监督学习“(unsupervised learning)--聚类

机器学习的目标是为了使得学得的模型能更好地适用于新样本。而不仅仅是再训练样本上工作的好。——泛化(generalization)

1.3假设空间

归纳(induction)——特殊到一般的泛化

演绎(deduction)——一般到特殊的”特化“(specialization)

1.4归纳偏好

任何一个有效的机器学习算法必有其归纳偏好,否则它将被假设空间中看似在训练集上"等效"的假设所迷惑,而无法产生确定的学习结果.
"若有多个假设与观察一致,则选最简单的那个”
对于一个学习算法A,若它在某 些问题上比学习算法B好,则必然存在另一些问题,在那里B比A 好有趣的是,这个结论对任何算法均成立
NFL(No Free Lunch Theorem)

 

 

 

 WEKA——机器学习算法程序库

 

第一章22页,学习完成 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值