- 博客(8)
- 收藏
- 关注
原创 机器学习——PCA方法人脸识别
其基本思想是通过线性变换将原始数据映射到一个新的坐标系中,以便最大程度地保留数据的方差,从而实现降维的同时最大程度地保留原始数据的特征。这种降维的方法不仅可以减少数据的维度,提高算法的计算效率,同时也能保留大部分原始数据的特征,有助于提高识别的准确性。变换矩阵W的选择将决定映射后的新特征空间,而PCA的目标是找到最佳的W,使得映射后的特征空间Y能够最大程度地保留原始数据的信息。根据特征值的大小,选择最大的k个特征值对应的特征向量作为变换矩阵W的列向量,得到W。可以使用交叉验证的方法来选择合适的维度。
2025-06-03 20:24:40
990
原创 机器学习——logistic回归
Logistic回归通过计算输入数据的线性组合(即加权和),然后应用一个逻辑函数将结果转换为0到1之间的概率值。假设现在有一些数据点,我们用一条直线对这些点进行拟合(该线称为最佳拟合曲线),这个拟合的过程就称作回归(如下图中的蓝色直线就为最佳拟合曲线)1>代码:通过线性回归计算出z,再将该数据输入sigmoid函数,转化为某个概率值,从而实现相应的测试集的分类。2>其中第一列表示该数据的横坐标,第二列表示数据的纵坐标,第三列表示该数据点的所属于的标签的类别,为0类或者是1类。
2025-05-19 14:31:01
1083
原创 机器学习——朴素贝叶斯
在本次机器学习的实验中,我采用了朴素贝叶斯算法进行分类任务。朴素贝叶斯基于特征之间的条件独立性假设,通过计算各特征属于不同类别的概率来进行预测。实验过程中,我准备了训练数据集和测试数据集,利用训练集学习模型参数,并使用测试集评估模型性能。在整个实验流程中,我学会了如何对相应的先验概率以及后验概率的计算,并通过朴素贝叶斯算法通过计算出的结果来对测试集进行分类。同时,也学会了当计算出的结果为0的情况,如何利用拉普拉斯平滑技巧来进行数据的更正,并重新计算出正确的结果。
2025-05-05 18:21:15
882
原创 机器学习——决策树
在每个节点,算法选择尚未被用来划分的具有最高信息增益的属性作为划分标准,然后递归地在每个子节点上应用同样的过程,直到生成的决策树能够完美分类训练样例或满足其他停止条件。通过计算信息增益,我们可以衡量每个特征对于分类模型的贡献程度,并选择最佳的特征进行数据集的划分。这个过程将数据集根据特征划分为不同的分支,每个分支对应于特征的一个取值,该分支上的数据集包含了特征取值与该分支对应的所有实例。所以可以得出,不同的构造决策树的算法,以不同的指标作为标准所计算出的最优特征会不同,因而构造出的决策树也会有所不同。
2025-04-20 15:17:30
840
原创 机器学习——模型评估
1.什么是模型评估在机器学习中,模型评估是指对训练好的机器学习模型进行性能测量的过程,以便了解模型对未见数据的泛化能力。对模型进行评估的主要目的是验证模型的预测准确性和适用性,并且从中获取有关模型表现的有价值的统计数据。验证集PR曲线和ROC曲线是模型评估的“双刃剑”,选择依据核心在于数据特性和业务需求PR曲线:聚焦正类识别,适合不平衡数据或需精准召回的场景。ROC曲线:评估整体性能,适合平衡数据或需权衡误判成本的场景。模型评估在机器学习中至关重要。
2025-03-26 12:00:00
1254
原创 机器学习——kNN算法解决海伦约会问题
算法的核心思想是,即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例,这K个实例的多数属于某个类,就把该输入实例分类到这个类中。经过一番总结,她发现曾交往过三种类型的人:不喜欢的人,魅力一般的人,极具魅力的人。(4)使用算法:首先需要输入样本数据和结构化的输出结果,然后运行k-近邻算法,判定输入数据分别属于哪个分类,最后应用,对计算出的分类执行后续的处理。(3)分析数据:当拥有了适当的数据量后,通过对数据的分析,根据需要,取得适合的K值。2.玩视频游戏所消耗时间百分比。
2025-03-24 12:20:54
978
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅