
学习机器学习
文章平均质量分 71
starrow
介绍
展开
-
15. 偏差-方差权衡(续)
以K近邻回归模型为例,说明偏差-方差权衡。原创 2022-10-16 11:33:20 · 546 阅读 · 1 评论 -
14. 偏差-方差权衡
在根据训练数据拟合出预测函数后,通过分析该函数在测试实例处的损失期望值,可以获得关于预测误差的重要知识。下面基于叠加模型,对回归预测函数进行计算,其结论对分类同样适用。原创 2022-10-16 11:30:39 · 953 阅读 · 0 评论 -
13. K近邻模型
设某回归任务的输入包含两个变量,将它们的值视为平面上点的坐标。如图2.1所示,灰点代表训练数据中的输入,白点代表输出待预测的输入。假如采用2.3节介绍的平均值法,当白点与黑点重合时,因为在该处只有一个训练实例,所以平均值不能很好地代表期望值;而当白点处于更有可能的其他位置时,因为在该处没有训练实例,无法预测输出值。为走出此困境,自然的想法是,在计算平均值时,扩大取其输出的实例的范围。假设输出待预测的输入为x,原来要求找到训练数据中输入等于x的实例,现在则放宽到所有输入处于x的某邻域的实例。在图2.1中,以白原创 2022-10-16 11:23:52 · 816 阅读 · 0 评论 -
12. 归纳偏好
2.2节的成果令人振奋,因为回归和分类预测函数的表达式不仅精确,而且普适。然而,条件期望值或条件概率最大的类别仅有理论意义,而无法用于实际模型。以回归为例,在输出关于输入的条件概率分布未知的状况下,只能根据训练数据集来求输出条件期望的近似值,即对于某个待预测的输入值,在训练数据中找出所有具有同样输入的实例,取它们输出的平均值原创 2022-10-16 11:18:23 · 540 阅读 · 0 评论 -
11. 分类损失最小化
针对分类输出值的离散性,通常用矩阵定义损失。比如,对于普通患者被机器人医生诊断为严重,可以设定一个损失值;对于重症患者被诊断为健康,可以设定另一个损失值。设输出有K个类别,总共有K × K种不同情况需要设定损失值,用一个K × K的矩阵L表示,第k行第l列的元素为,将实际属于类别k的实例归入类别l的损失值。原创 2022-10-16 11:16:19 · 725 阅读 · 0 评论 -
10. 回归损失最小化
要评价监督学习的表现,自然的想法是使用模型预测的输出与真实的输出之间的误差(Error)[[1]],不过原始的误差不能直接用于计算:对于回归,误差和输出值同样是实数,既可能是正数,也可能是负数,累加时会相互抵消,不能计算多个实例的误差之和;对于分类,输出的实际值和预测值都是定性的,误差因而是描述性的,无法计算其大小。所以,需要用另一个定量的标准来反映误差的大小。我们将该标准称为损失(Loss),根据输出的实际值和预测值来定义损失的函数称为损失函数L(y, f(x))[[2]]。损失越小,预测函数越准。损失函原创 2022-10-16 11:12:06 · 670 阅读 · 0 评论 -
9. 统计模型
监督学习的目标,是通过对给定训练数据集的学习,找到根据任意输入值能预测输出值的函数。在1.1.2节预测气温的例子中,输入是时间这一个变量;在1.1.1节购买汽车的例子中,输入包含年龄和收入两个变量;在更复杂的问题中,输入会包含更多的变量。比如,伽利略想知道物体下落的时间与哪些因素有关,他在试验中使用不同材料、重量的物体,从不同的高度落下;在实验数据中,每一组输入就包含材料、重量和高度三个变量的值。推广到一般情况,监督学习的输入X由任意d个实值变量组成,可以用一个d维实向量来表示。原创 2022-10-14 09:52:42 · 215 阅读 · 0 评论 -
8. 监督学习的统计理论
在2018年,2011年诺贝尔经济学奖获得者托马斯·萨金特(Thomas J. Sargent)在世界科技创新论坛上表示,人工智能其实是统计学披上华丽的辞藻。人工智能的研究者当然可以反驳,说萨金特先生的论断片面和不准确。不过,具体到人工智能中的机器学习,许多统计学家在接触后都恍然大悟——种种概念和理论不都是统计学中早已熟悉的吗,只是换了新术语。例如,预测变量被换成输入,响应变量换成输出,定性值换成类别。机器学习和统计学的深厚渊源,使得在介绍监督学习模型前,先用一章奠定其共同的统计理论基础,大有益处。原创 2022-10-14 09:47:45 · 327 阅读 · 0 评论 -
7. 直接策略搜索及学习过程
强化学习的另一类解法建立策略的参数模型,将最优化问题的目标函数变为以参数θ为自变量的复杂函数ρ(θ),然后发展出各种方法估算这些函数。例如,DeepMind公司开发的强化学习模型将Atari公司推出的一系列游戏的画面像素作为输入,用深度神经网络学习玩游戏的策略,在很多游戏中水平都超过了人类玩家。原创 2022-10-14 09:44:29 · 251 阅读 · 0 评论 -
6. 值函数估计
值函数估计的方法继承了马尔科夫决策过程解法的基本思路。为了方便讨论和处理,定义动作-值函数(Action-value function),或称为Q函数[ ],为累计折扣奖励关于环境的初始状态s、主体在该状态所选动作a和随后所用策略π三者的条件期望值原创 2022-10-13 10:01:17 · 165 阅读 · 0 评论 -
5. 马尔科夫决策过程
强化学习要解决的问题,在数学上可以抽象为应用广泛的马尔科夫决策过程(Markov decision process)。马尔科夫决策过程研究如何在一个带有随机性的过程和离散的时间序列中做决策。原创 2022-10-13 09:52:32 · 255 阅读 · 0 评论 -
4. 非监督学习与强化学习简介
机器学习的第二种范式是非监督学习(Unsupervised learning),目标是从数据中找出模式。监督学习接收的是有标记的数据,非监督学习处理的则是没有标记的数据。换句话说,非监督学习没有已知的输出作为标准,而是试图发现数据中存在的模式。根据模式的性质,非监督学习可分为两个领域。一个领域是聚类分析,根据数据实例的相似性将它们划分进不同的集群。聚类分析有许多应用,例如,对像素聚类能够分割图像,对词语聚类可以找出同义词,对文章聚类能够将它们按主题归档。原创 2022-10-13 09:47:04 · 455 阅读 · 0 评论 -
3. 监督学习之回归及归纳偏好
用一个简单的例子来说明回归。这次我变成一个天气爱好者,想知道每天不同时间的气温。预测函数的输入是时间,输出是该时间的气温。回归也需要训练数据,这里的数据是我记录的一天当中若干时刻的气温。如图1.6所示,横轴代表一天的时间,不妨设原点左边为白天,右边为晚上;纵轴代表气温。横轴上标出的几个点代表记录气温的时间,其上方的点表示所记录的气温值。原创 2022-10-12 12:13:38 · 391 阅读 · 0 评论 -
2. 监督学习之分类
机器学习的第一种范式是监督学习(Supervised learning),学习的目标是根据输入预测输出的函数。例如,输入是患者的检查数据,输出是疾病的诊断结果;输入是动物图片,输出是它们的名称;输入是未来的某个日期,输出是该日的降雨量。输出值定性还是定量,对问题描述和所用学习方法影响很大,因而习惯上监督学习以其为标准分为两个主题。如果输出值是定性和离散的,监督学习称为分类(Classification),其输出值又称为类别,如患者某项疾病的诊断结果。如果输出值是定量的(常常是连续的),监督学习则称为回归原创 2022-10-12 11:59:20 · 2234 阅读 · 0 评论 -
1. 机器学习简介
机器学习是一个充满科幻感的词,会让人想到一台能够学习说话、跳舞和下棋的聪明的机器。然而正如家里会四处移动扫地的圆盘和工厂里组装汽车的机械臂被称为机器人,机器学习大部分研究的问题和应用比起我们想象中的智能机器人要低调和朴实得多。实际上,机器学习并不是一门近期诞生和独立发展起来的学科,现在被纳入该学科的许多知识和成果都来自统计学、最优化理论、数据挖掘、模式识别、自动控制等诸多理论和应用学科的积累。换言之,机器学习是作为一门交叉学科逐渐确立起自己的身份的。那么作为本书讨论的主题,机器学习的含义是什么?原创 2022-10-12 11:45:29 · 229 阅读 · 0 评论