MLAPP读书笔记(一)监督式学习与非监督式学习简介
机器学习的类别
一:预测/监督式学习{(x, y)}
1.分类
2.回归
1)序数回归
二:描述式/非监督式学习{x}
特点:自行发现知识
三:增强学习 reinforcement learning RL
通过奖励和惩罚来刺激学习
在输入矩阵A中,每行是一个特征向量xi,表示一个样本。
N x D,表示N个样本,每个样本有D个描述。
分类:
本质是从x到y的映射。y是有限个类别。
当y=2 y ∈ {0, 1},是二分类(binary classification)
当y>2,是多分类(multiclass classification)
1)如果分类不是互斥的,如又高又壮 ,称为多标签分类(multi-label classification),等价于多个相关的二分类,归属于多输出模型。
2)通常讲的是单输出的多分类,即只有一个输出。
在新的输入样上预测称为泛化(generalization).
p(y|x,D) x表示特征向量,D表示测试集。
p(y|x,D,M) M表示模型。
argmax: 在x,D的条件下,y=c, c在y的值域空间都是有可能的。取概率最大的那一个的运算就是argmax运算。也称为最大化后验MAP(maximum a posteriori).
当概率远离1时,回答"我不知道"。
应用:
1.文档分类
特定的文档分类:垃圾邮件过滤。
在单词包的情况
机器学习的类别
一:预测/监督式学习{(x, y)}
1.分类
2.回归
1)序数回归
二:描述式/非监督式学习{x}
特点:自行发现知识
三:增强学习 reinforcement learning RL
通过奖励和惩罚来刺激学习
在输入矩阵A中,每行是一个特征向量xi,表示一个样本。
N x D,表示N个样本,每个样本有D个描述。
分类:
本质是从x到y的映射。y是有限个类别。
当y=2 y ∈ {0, 1},是二分类(binary classification)
当y>2,是多分类(multiclass classification)
1)如果分类不是互斥的,如又高又壮 ,称为多标签分类(multi-label classification),等价于多个相关的二分类,归属于多输出模型。
2)通常讲的是单输出的多分类,即只有一个输出。
在新的输入样上预测称为泛化(generalization).
p(y|x,D) x表示特征向量,D表示测试集。
p(y|x,D,M) M表示模型。
argmax: 在x,D的条件下,y=c, c在y的值域空间都是有可能的。取概率最大的那一个的运算就是argmax运算。也称为最大化后验MAP(maximum a posteriori).
当概率远离1时,回答"我不知道"。
应用:
1.文档分类
特定的文档分类:垃圾邮件过滤。
在单词包的情况

本文是MLAPP读书笔记的第一部分,主要介绍了机器学习的两大类别——监督式学习和非监督式学习。监督式学习包括分类和回归,如文档分类、图片分类和对象检测。非监督式学习则涉及密度估计和数据聚类,如发现集群、潜在变量和矩阵补全。此外,还探讨了这两种学习方式在不同领域的应用实例。
最低0.47元/天 解锁文章
4448

被折叠的 条评论
为什么被折叠?



