《统计学习方法》学习笔记-生成模型与判定模型

本文介绍了监督学习的基本概念,包括生成方法和判别方法,并对比了两者的不同特点。此外还概述了统计学习方法的主要组成部分及其在监督学习中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

监督学习的任务就是学习一个模型,应用这一模型,对给定的输入预测对应的输出。这个模型的一般形式为决策函数:

Y=f(X)Y=f(X)

或者条件概率分布:
P(Y|X)P(Y|X)

监督学习方法又可以分为生成方法和判别方法,所学到的模型称为生成模型和判别模型。
生成方法由数据学习联合概率分布P(X,Y)P(X,Y),然后求出条件概率分布P(Y|X)P(Y|X)作为预测的模型,即生成模型:
P(Y|X)=P(X,Y)/P(X)P(Y|X)=P(X,Y)/P(X)

这样的方法之所以称为生成方法,是因为模型表示了给出输入X产生输出Y的生成关系。典型的生成模型有:朴素贝叶斯法和隐马尔科夫模型。
判别方法由数据直接学习决策函数f(X)f(X),或者条件概率分布P(Y|X)P(Y|X)作为预测模型,即判别模型。判别方法关心的是对于给定的输入XX,应该预测什么样的输出Y,典型的判别模型包括K近邻法,感知机,决策树,逻辑斯帝回归模型,最大熵模型,支持向量机,提升方法和条件随机场等。
生成方法的特点:生成方法可以还原出联合概率分布P(X,Y)P(X,Y),而判别方法不能;生成方法的学习收敛速度更快。即当样本容量增加时,学到的模型可以更快的收敛于真是模型;当存在隐变量时,仍可以用生成方法学习,此时判别方法就不能用。
判别方法的特点:判别方法直接学习的是条件概率P(Y|X})P(Y|X})或决策函数f(x)f(x),直接面对预测,往往学习的准确率更高;由于直接学习P(Y|X})P(Y|X})f(x)f(x),可以对数据进行各程度上的抽象、定义特征并使用特征,因此可以简化学习问题。

《统计学习方法》第一章总结:

  • 1 统计学习是关于计算机基于数据构建概率统计模型并应用模型对数据进行分析与预测的一门学科。统计学习包括监督学习、非监督学习、半监督学习和强化学习。
  • 2 统计学习方法三要素——模型、策略和算法,对理解统计学习方法起到提纲挈领的作用。
  • 3 本书主要讨论监督学习,监督学习可以概括如下:从给定有限的训练数据出发,假设数据是独立同步的,而且假设模型属于某个假设空间,应用某一评价准则,从假设空间中提取一个最优的模型,使它对已给训练数据及未知测试数据在给定评价标准意义下最有准确性的预测。
  • 4 统计学习中,进行模型选择或者提高学习的泛化能力是一个重要问题。如果只考虑减少训练误差,就可能产生过拟合现象。模型选择的方法有正则化和交叉验证。学习方法泛化能力的分析是统计学习理论研究的重要课题。
  • 5 分类问题、标注问题和回归问题都是监督学习的重要问题。本书中介绍的统计学习方法包括感知机、K近邻、朴素贝叶斯法、决策树、逻辑斯蒂回归与最大熵模型、支持向量机、提升方法、EM算法、隐马尔科夫模型和条件随机场。这些方法是主要的分类、标注及回归方法。它们又可以归类为生成方法和判别方法。
基于Spring Boot搭建的一个多功能在线学习系统的实现细节。系统分为管理员和用户两个主要模块。管理员负责视频、文件和文章资料的管理以及系统运营维护;用户则可以进行视频播放、资料下载、参学习论坛并享受个性化学习服务。文中重点探讨了文件下载的安全性和性能优化(如使用Resource对象避免内存溢出),积分排行榜的高效实现(采用Redis Sorted Set结构),敏感词过滤机制(利用DFA算法构建内存过滤树)以及视频播放的浏览器兼容性解决方案(通过FFmpeg调整MOOV原子位置)。此外,还提到了权限管理方面自定义动态加载器的应用,提高了系统的灵活性和易用性。 适合人群:对Spring Boot有一定了解,希望深入理解其实际应用的技术人员,尤其是从事在线教育平台开发的相关从业者。 使用场景及目标:适用于需要快速搭建稳定高效的在线学习平台的企业或团队。目标在于提供一套完整的解决方案,涵盖从资源管理到用户体验优化等多个方面,帮助开发者更好地理解和掌握Spring Boot框架的实际运用技巧。 其他说明:文中不仅提供了具体的代码示例和技术思路,还分享了许多实践经验教训,对于提高项目质量有着重要的指导意义。同时强调了安全性、性能优化等方面的重要性,确保系统能够应对大规模用户的并发访问需求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值