机器学习------0_绪论

本文深入探讨了机器学习的基本概念,涵盖了监督学习、无监督学习、半监督学习和强化学习等主要类型。详细解析了分类、回归、聚类等常见问题及对应的算法,如逻辑回归、BP神经网络、K-Means等。

机器学习基础:

机器学习是从数据中学习和提取有用的信息,不断提升机器的性能。那么对于一个具体的机器学习的问题,很重要的一部分是对数据的收集,我们称这部分为训练数据。机器学习是从这些数据中学习规则,利用学习到的规则来预测新的数据。

机器学习算法的分类:

  • 在机器学习中根据任务的不同可以分为监督学习、无监督学习、半监督学习和增强学习。
  • 监督学习的训练数据中包含了类别的信息,如在垃圾邮件的检测中,其训练样本包含了邮件的类别信息。如在垃圾邮件的检测中,其训练样本包含了邮件的类别信息:垃圾邮件和非垃圾邮件。在监督学习中典型的问题是分类和回归,典型的算法有:Logistic Regression和BP神经网络和线性回归算法。
  • 与监督学习不同的是,无监督学习的训练数据中不包含任何类别的信息。在无监督学习中,其典型的问题为聚类问题,典型的算法有K-Means算法、DBSCAN算法等。
  • 半监督学习的训练数据中有一部分数据包含类别信息,同时有一部分数据不包含类别信息,是监督学习和无监督学习的融合。在半监督学习中,其算法是在监督学习的算法上进行扩展,使之可以对未标注信息进行建模。
  • 监督学习和无监督学习上使用较多的两种学习方法,而半监督学习是监督学习和无监督学习的融合。
监督学习:
  • 前面简单介绍了监督学习的概念,监督学习是机器学习算法中的一种重要的学习方法,在监督学习中默契训练样本包含有特征和标签信息。在监督学习中,分类算法和回归算法是两类最重要的算法。两者之间最重要的区别是分类算法中的标签是离散的值,如广告点击问题中标签为{-1, +1},分别代表广告点击和未点击,而回归算法中的标签值是连续的值,如通过人的身高、体重、性别等信息预测人的年龄,因为年龄是连续的正整数,因此标签为[1, 80]。
监督学习的流程:

监督学习流程

  • 对于具体的监督学习任务,首先是获取到带有属性值的样本,假设有m个训练样本m1,m2 … ,然后对样本进行预处理,过滤数据中的杂质,保留其中有用的信息,这个过程称为特征处理和特征提取。
  • 通过监督算法习得样本特征到样本标签之间的假设函数。监督学习通过从样本数据中习得假设函数,并用其对新的数据进行预测。
监督学习算法
  • 分类问题是指通过训练数据学习一个从观测样本到离散的标签的映射,分类问题是一个监督学习问题。典型的问题有:垃圾邮件的分类。训练样本是邮件中的文本,标签是每个邮件是否是垃圾邮件{-1, +1}(-1代表垃圾邮件,+1代表不是垃圾邮件)。目标是根据这些带标签的样本,预测一个新邮件是否是垃圾邮件;点击率预测:训练样本是用户、广告和广告主的信息,标签是否被点击{-1, +1} (+1代表点击,-1代表未点击)。目标是在广告主发布广告后,预测指定的用户是否会点击,上述两种问题都是二分类问题。手写数字的识别:即是识别{0, … ,9}中的那个数字,这是一个多分类问题。
  • 与分类问题不同的是,回归问题。回归问题是指通过训练数据学习一个从观测样本到连续的 标签的映射,在回归问题是一系列连续的值。典型的问题有:股票价格的预测,即利用股票的历史价格预测未来的股票价格;房屋价格的预测:即利用房屋的数据,如:房屋的面积,位置等信息来预测房屋的价格。
无监督学习
  • 无监督学习是另一种机器学习算法,与监督学习不同的是,在无监督学习中,其样本只含有特征,不包含标签信息,与监督学习不同的是由于无监督学习不包含标签信息,在学习时其分类结果是否正确。
无监督学习的流程:

无监督学习流程图

  • 对于无监督学习任务,首先是获取到带有特征值的样本,建设有m个样本,对这m个样本进行处理,得到样本中有用的信息,这个过程称为特征处理或者特征提取,最后是通过无监督学习算法处理这些样本,如利用聚类算法对这些样本进行聚类。
无监督的学习算法
  • 聚类算法是无监督算法中最典型的一种学习算法。聚类算法利用样本的特征,将具有相似特征的样本划分到同一个类别中,而不关心这个类别具体是什么。
  • 除了聚类算法,在无监督学习中还有一类比较重要的算法是降维的算法,数据降维基本原理是将样本点从输入空间通过线性或者非线性变换映射到一个低纬空间,从而获得一个关于原始数据集紧致的低纬表示。
推荐系统和深度学习
  • 在机器学习中,除了按照上述的分类将算法分为监督学习和无监督学习之外,还有一些其他的分类算法,如按照算法的功能,将算法分为分类算法、回归算法、聚类算法和降维算法等。随着机器学习领域的不断发展,出现了很多新的研究方向,推荐算法和深度算法是近年来研究较多的算法。
推荐算法
  • 随着信息量的急剧扩大,信息过载的问题变得尤为突出,当用户无明确的信息需求时,用户无法从大量的信息中获取到感兴趣的信息,同时,信息量的急剧上升也导致了大量的信息被埋没,无法接触到一些潜在客户。推荐系统的出现被称为连接用户和信息的桥梁,一方面帮用户从海量数据中找到感兴趣的信息,另一方面将有价值的信息传递给潜在用户。
  • 中推荐系统中,推荐算法起了至关重要的作用。常见的推荐算法有:协同过滤算法,给予矩阵分解的推荐算法和基于图的推荐算法。
深度学习
  • 传统的机器学习算法都是利用浅层的结构,这些结构一般包含一到两层的非线性特征变换,浅层结构在解决很多简单的问题上效果尤为明显,但是在处理一些更加复杂的雨自然信号问题时,就会遇到更多的问题/
  • 随着计算机的不断发展,2006年Hinton等人提出了逐层训练的概念,深度学习又一次进入人们的视野,数据量的不断扩大以及计算机计算能力的增强,使得深度学习技术成为可能。在深度学习中,常见的几种模型包括:1、自编码器模型,通过堆叠自编码器来构建深层网络;2、卷积神经网络,通过卷积层与采样层的不断交替构建深层网络;3、循环神经网络。
(Mathcad+Simulink仿真)基于扩展描述函数法的LLC谐振变换器小信号分析设计内容概要:本文围绕“基于扩展描述函数法的LLC谐振变换器小信号分析设计”展开,结合Mathcad与Simulink仿真工具,系统研究LLC谐振变换器的小信号建模方法。重点利用扩展描述函数法(Extended Describing Function Method, EDF)对LLC变换器在线性工作条件下的动态特性进行线性化近似,建立适用于频域分析的小信号模型,并通过Simulink仿真验证模型准确性。文中详细阐述了建模理论推导过程,包括谐振腔参数计算、开关网络等效处理、工作模态分析及频响特性提取,最后通过仿真对比验证了该方法在稳定性分析与控制器设计中的有效性。; 适合人群:具备电力电子、自动控制理论基础,熟悉Matlab/SimulinkMathcad工具,从事开关电源、DC-DC变换器或新能源变换系统研究的研究生、科研人员及工程技术人员。; 使用场景及目标:①掌握LLC谐振变换器的小信号建模难点与解决方案;②学习扩展描述函数法在线性系统线性化中的应用;③实现高频LLC变换器的环路补偿与稳定性设计;④结合Mathcad进行公式推导与参数计算,利用Simulink完成动态仿真验证。; 阅读建议:建议读者结合Mathcad中的数学推导与Simulink仿真模型同步学习,重点关注EDF法的假设条件与适用范围,动手复现建模步骤频域分析过程,以深入理解LLC变换器的小信号行为及其在实际控制系统设计中的应用。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值