《统计学习方法》笔记(一)

本文解析了机器学习中常见的模型,包括判别模型和生成模型的区别,介绍了感知机、K近邻算法、朴素贝叶斯法等,并探讨了监督学习、无监督学习及半监督学习的概念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

模型学习策略风险函数判别/生成
感知机误分类点到超平面的总距离经验风险最小化判别模型
K近邻误分类的概率经验风险最小化判别模型
朴素贝叶斯法后验概率最大化极大似然估计:期望风险最小化;贝叶斯估计:结构风险最小化生成模型
决策树选取信息增益最大的特征分类结构风险最小化判别模型

监督学习和无监督学习

我的理解是,是否有监督(supervised),就看输入数据是否有标签(label)。输入数据有标签,则为有监督学习,没标签则为无监督学习。训练数据的一部分是有标签的,另一部分没有标签,那就是半监督学习(semi-supervised learning),通常没标签数据的数量常常极大于有标签数据数量。
例如,假如输入数据是已经分好类的样本,样本的种类就是标签,则为有监督学习,如果没有分类,计算机就需要自己按照相似度自动划分出类别,也就是聚类。


生成模型和判别模型

我是这样理解的:
生成模型,就是生成(数据的分布)的模型;
判别模型,就是判别(数据输出量)的模型;
更进一步:
从结果角度,两种模型都能给你 输出量(label 或 y etc.)。
但,生成模型的处理过程会告诉你关于数据的一些统计信息(p(x|y) 分布 etc.),更接近于统计学;
而 判别模型则是通过一系列处理得到结果,这个结果可能是概率的或不是,这个并不改变他是不是判别的。
如,决策树的if then说不是这个就是那个(而很多属性都是有分布的)【即分支】,明显是一种判别;
而朴素贝叶斯说,模型生成了一个分布给你了
k近邻法、感知机、逻辑斯谛回归模型、最大熵模型、支持向量机、提升方法是判别模型;
朴素贝叶斯、隐马尔可夫模型(重点的EM算法)是生成模型。

来自知乎:https://www.zhihu.com/question/20446337/answer/45130939


精确率和召回率

这里写图片描述
这里写图片描述

来自知乎:https://www.zhihu.com/question/19645541


向量的范数

这里写图片描述


决策树

决策树之ID3算法

原理及代码:http://blog.youkuaiyun.com/acdreamers/article/details/44661149

决策树之CART算法

原理及代码:http://blog.youkuaiyun.com/acdreamers/article/details/44664481

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值