统计学习方法-笔记

本文介绍了多种机器学习方法,包括感知机、K近邻法、朴素贝叶斯、决策树等,并详细阐述了它们的应用范围、特点及学习策略。同时对比了生成模型与判别模型的不同之处。

方法适用特点类型学习策略损失函数学习方法
感知机二分类分离超平面判别模型极小化误分点到超平面距离误分点到超平面距离随机梯度下降
K近邻法多分类,回归特征空间,样板点判别模型
朴素贝叶斯多分类特征与类别的联合概率分布,条件独立假设生成模型极大似然估计,极大后验概率估计对数似然损失概率计算公式.EM算法
决策树多分类,回归分类树,回归树判别模型正则化的极大似然估计对数似然损失特征选择,生成,剪枝
逻辑斯谛回归与最大熵模型多分类特征条件下类别的条件概率分布,对线性模型判别模型极大似然估计,正则化的极大似然估计逻辑斯谛损失改进的迭代尺度算法,梯度下降,拟牛顿法
支持向量机二分类分离超平面,核技巧判别模型极小化正则化合页损失,软间隔最大化合页损失序列最小最优化算法
提升算法二分类弱分类器的线性组合判别模型极小化加法模型的指数损失指数损失前向分步加法算法
EM算法概率模型参数估计含隐变量概率模型极大似然估计,极大后验概率估计对数似然损失迭代算法
隐马尔科夫模型标注观测序列与状态序列的联合概率分布模型生成模型极大似然估计,极大后验概率估计对数似然损失概率计算公式,EM算法
条件随机场标注状态序列条件下观测序列的条件概率分布,对数线性模型判别模型极大似然估计,正则化极大似然估计对数似然损失改进的迭代尺度算法,梯度下降,拟牛顿法

表格中的内容来着<统计学习方法>第12章

表格中的生成模型和判别模型的定义为:

生成模型:由数据学习联合概率分布P(X,Y),然后求出条件概率分布P(Y|X),作为预测模型.即:P(Y|X)=P(X,Y)/P(X)

模型表示了给定输入X产生输出Y的生成关系.

判别模型:由数据直接学习决策函数法f(x)或者条件概率分布P(Y|X)作为预测的模型.


生成方法的特点:生成方法可以还原出联合概率分布P(X,Y),而判别方法则不能;生成方法的学习收敛速度更快,即当样本容量增加的时候,学到的模型可以更快的收敛与真实的模型;当存在隐变量时,仍可以用生成方法学习,此时判别方法不能用.

判别方法的特点:判别方法直接学习的是条件概率P(Y|X),或决策函数f(x),直接面对预测,往往学习的准确率更高;由于直接学习P(Y|X)

或者f(x)可以对数据进行各种程度的抽象,定义特征并使用特征,因此可以简化学习问题. 




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值