- 博客(7)
- 收藏
- 关注
原创 【机器学习】第十三章 主成分分析PCA
PCA,即主成分分析法,主要用于对数据的降维,可以通过线性变换将原始数据投影到新的坐标系上实现降维,使其数据更加便于理解,其中这些新的坐标轴称为主成分,按照其对应的方差大小依次排列,第一主成分对应方差最大,第二主成分对应方差次大,以此类推。什么是降维?降维是指通过保留一些重要特征并去除冗余特征,减少数据特征的维度的过程为什么要进行PCA降维处理?(1)高维数据增加了运算难度,故可以降低许多算法的计算开销(2)高维数据使得算法的泛化能力变弱,故可以提高泛化能力。
2024-06-23 16:34:06
663
原创 【机器学习】第六章 支持向量机
在特征空间中寻找一个最优的超平面来对样本进行分割,分割的原则是最大化不同类别数据点之间的间隔,同时确保这些数据点被正确分类通过本次学习,我对SVM有了更进一步的理解,相对于前面学习到的几个分类方法,SVM因为具有更加良好的泛化能力和对高维数据的处理能力,特别适用于处理数据集较小的情况。SVM对数据进行分类的核心思想就是在特征空间中寻找一个超平面,然后以最大限度地分隔开不同类别的数据点。
2024-06-11 12:19:09
679
原创 【机器学习】第五章 Logistic回归
(1)回归算法主要解决连续数据的问题,用来预测数值型数据,即可以建立一个函数,然后通过输入自变量来预测一个连续目标变量。如房价预测中,可以通过输入房屋的面积、房间数等特征来预测输出房屋的价格对象:连续变量重点:数值预测的准确性常见:线性回归等(2)分类算法主要解决离散数据的问题,对数据进行分类,即将输入数据划分到预定义的类别,如图像识别、文本分类等例子中对对象进行分类对象:离散变量重点:对象分类的准确度常见:决策树、支持向量机,逻辑回归等。
2024-05-28 23:08:22
1090
1
原创 【机器学习】第四章 朴素贝叶斯
朴素贝叶斯是一种基于贝叶斯定理与特征条件独立假设的分类算法(其中比贝叶斯多出来的“朴素”就是指各个特征条件独立),其核心思想是通过考虑各个特征的概率来预测分类(即对于给出的待分类样本,计算该样本在每个类别下出现的概率,最大的就被认为是该分类样本所属于的类别借此机会,我更加深入的学习到了朴素贝叶斯的相关知识,了解到了相关的计算方式,算法以及适用的几种模型,同时我也更加了解到了前面提到的关于朴素贝叶斯的其中一个缺点:对于输入数据的准备方式比较敏感,需要对数据进行适当的预处理。
2024-05-10 22:59:36
1171
1
原创 【机器学习】第三章 决策树
在机器学习中,决策树是一种用于分类和回归的树形结构模型。在上述探讨决策树的相关知识时,主要涉及了它的基本理念、各种算法、相关实例的代码实现,以及如何通过剪枝策略来避免过拟合。决策树以其直观的图形结构来展示数据,使得数据分类和分析结果一目了然,在一定程度上,有助于我们对数据进行分类并直观呈现分析结果。但是另一方面上,决策树也有一个显著的问题:比较容易对训练数据过度适应,特别是在特征众多的情况下,这样就可能会导致过拟合。
2024-04-28 00:52:37
1223
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅