- 博客(8)
- 收藏
- 关注
原创 机器学习——主成分分析PCA(Principal Component Analysis)
PCA(Principal Component Analysis,主成分分析)是一种无监督学习的降维方法。它基于一个简单的前提:一个高维数据集可能包含许多冗余或相关的特征,而这些特征可能并不都包含有价值的信息。PCA的目标是通过线性变换找到数据的主要成分,即数据的最大方差方向,并将数据投影到这些主要成分上,从而在保持数据的主要特性的同时降低数据的维度。通过本次实验,我们验证了PCA在人脸识别特征降维中的有效性。
2024-06-24 15:37:11
1102
原创 机器学习——支持向量机 (Support Vector Machine)
SVM的定义如下:支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解的最大边距超平面(maximum-margin hyperplane)。下面举一个二维数据的例子,在以下数据点中,对于颜色不同的点,我们可以找一条线将二者分开,以实现分类的目的。
2024-06-11 06:48:34
861
1
原创 机器学习——逻辑回归(Logistic Regression)
这里,np.ones((X_train.shape[0], 1)) 创建了一个形状为 (n_samples, 1) 的数组,其中 n_samples 是 X_train 的样本数量,所有元素的值都是1。在逻辑回归中,这个函数的主要目的是将线性模型的输出转换为一个介于0和1之间的概率值,这样我们就可以用这个概率值来判断某个样本属于正类(例如,标签为1)的。在逻辑回归中,当我们已经有了线性回归模型的基础后,为了将模型的输出转换为概率值(即预测某个事件发生的可能性),我们引入了sigmoid函数。
2024-05-28 18:02:08
826
原创 机器学习——朴素贝叶斯(Naive Bayes)
PA∣BPB∣A⋅PAPBPA∣BPBPB∣A⋅PAPA∣B\ P(A|B)PA∣B表示在事件B\ BB发生的条件下,事件A\ AA发生的概率;PB∣A\ P(B|A)PB∣A表示在事件A\ AA发生的条件下,事件B\ BB发生的概率;PA\ P(A)PA和PB\ P(B)PB分别表示事件A\ AA和事件B\ BB单独发生的概率。
2024-05-13 11:28:26
2734
原创 机器学习——决策树(Decision Tree)
本文详细介绍了决策树的理论基础,包括最优属性选择的三种方法,并通过Python代码展示了如何使用scikit-learn库创建决策树、评估模型性能并进行可视化。在实际应用中,我们可以根据数据的特点和需求选择合适的最优属性选择方法。这次实验也让我对决策树有了更深的理解和看法,重点就是掌握决策树的决策理论以及最优属性的选择方法,实验过程中我也遇到了很多困难,比如对Python不熟悉对scikit-learn库中的函数不熟悉。最后,希望在之后的机器学习之旅我能更上一层楼,期待下一次机器学习算法实验。
2024-04-29 12:14:03
1688
原创 机器学习——分类模型评估、ROC曲线、PR曲线
ROC曲线(受试者工作特征曲线)和PR曲线(精确率-召回率曲线)是两种用于评估分类模型性能的重要工具。ROC曲线以真正例率(TPR,即召回率)为纵轴,假正例率(FPR)为横轴,通过不同阈值下的TPR和FPR绘制而成。PR曲线则以召回率为横轴,精确率为纵轴,同样通过不同阈值下的召回率和精确率绘制。导入数据后,就需要选择分类器来进行训练,这里我选择了以下几个分类模型。逻辑回归(Logistic Regression):逻辑回归是一种广义的线性回归模型,常用于处理因变量为二分类(0或1)的问题。
2024-04-16 14:09:10
2501
原创 机器学习——KNN算法实战
本文主要介绍博主学习完机器学习的第一个算法——KNN之后的实验和心得,主要包括对鸢尾花数据集进行分析和运用KNN算法划分鸢尾花种类的过程。因为是第一次实验,所以是根据《机器学习实战》这本书上的代码实现过程作为参考,并没有调用sklearn库来直接运用KNN算法模型。这是第一次机器学习的实验,有很多机器学习的概念都不是很清楚,对Python也不是特别熟悉,所以整个过程还是比较困难的,但是算是自己将整个代码敲下来了,也学到了很多,希望下次实验能更加得心应手,能学到更多机器学习的知识,并且增强自己的动手实践能力。
2024-04-01 13:43:03
2494
原创 Anaconda、VS code的安装
通过Anaconda和VS Code,我们就可以进行机器学习的学习了,因为博主自己先前就配置好了Anaconda,所以很多步骤是没有截图的,但是Anaconda安装的基本步骤就是官网下载—>勾选所需选项(最好是自动添加路径)—>命令行检查是否安装完成,而VS Code 的安装就更简单了,直接官网下载然后在扩展商店配置Python环境就可以了,当然,很多环境方面的问题可以在后续的机器学习的学习过程中进行完善。Anaconda提供了丰富的数据科学库和强大的环境管理功能,而VS Code可以用来编辑代码。
2024-03-18 17:36:01
254
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人