身如云泥意贯一-优快云博客

原创机器学习-PCA降维

PCA 的本质是通过线性代数中的正交变换，将数据投影到最能表征其方差的子空间。其理论体系的核心是协方差矩阵的特征结构分析，核心优势在于无监督性、线性保真性和数学严格性，而局限性主要源于对线性结构的依赖和无标签假设。实践中的理论应用要点：标准化是前提：务必对数据进行均值中心化，量纲不一致时需额外标准化方差贡献率优先：通过累计方差曲线科学确定主成分数量，避免主观设定线性假设检验：降维前观察数据分布，若存在明显非线性结构（如流形分布），优先尝试核方法或非线性降维结合业务目标。

2025-06-12 16:31:04 840

原创机器学习-SVM

支持向量机是一种强大的机器学习算法，用于分类和回归。它通过最优超平面来分隔不同类别的样本，并具有较好的泛化能力和鲁棒性。然而，SVM在计算复杂度和参数选择方面存在挑战。在实际应用中，需要适当调整参数和进行模型优化。

2025-06-02 19:11:05 610

原创机器学习-逻辑回归

我们使用的数据集为，包含100条样本，每条样本有2个特征（x1x2）和1个二分类标签（y，0或1）。...任务目标：通过特征x1和x2训练模型，预测样本标签y。逻辑回归通过线性组合 + Sigmoid 函数将线性回归转化为概率分类，结合交叉熵损失和梯度下降实现模型优化。可解释性强：参数直接反映特征的影响方向和重要性；效率高效：适合大规模数据，常作为分类任务的基线模型；扩展性好：可通过特征工程（如多项式特征）处理非线性问题。通过理论与实战结合，我们既能理解算法本质，又能快速应用于实际场景。

2025-05-18 16:55:21 827

原创朴素贝叶斯

朴素贝叶斯算法凭借其简洁的原理和高效的性能，在机器学习领域占据着重要的地位。尽管它存在一些局限性，但在许多实际应用场景中，仍然能够发挥出色的作用。通过深入理解朴素贝叶斯的原理、类型、应用和优缺点，我们可以更好地将其应用于实际问题中，为数据分析和决策提供有力的支持。随着机器学习技术的不断发展，朴素贝叶斯算法也在与其他算法相结合，不断拓展其应用边界，为我们带来更多的惊喜和可能。

2025-05-05 18:47:34 931

原创机器学习-决策树特征选择

（Decision Tree）是一种经典的，广泛应用于分类和回归任务。它通过树形结构对数据进行递归划分，模拟人类“分而治之”的决策过程。

2025-04-21 18:51:06 2010

原创模型评估：P-R曲线绘制

P-R曲线用于衡量模型在不同阈值下的性能。P-R曲线展示了在不同阈值下的查准率和召回率之间的关系。查准率是指在所有预测为正例中实际为正例的比例，召回率是指在所有实际为正例中被正确预测为正例的比例。P-R曲线以召回率为横轴，查准率为纵轴。曲线上的每个点代表着在相应阈值下的查准率和召回率，而曲线本身则是通过连接这些点而得到的。P-R曲线的面积越大，表示模型的性能越好。

2025-04-06 15:57:25 1679

原创 Knn算法实现

如果一个样本在特征空间中的k个最邻近的样本中的大多数属于某一个类别，则该样本也划分为这个类别。KNN算法中，所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。其实到这里，大家会发现，在数据集确定的情况下，我们整个算法只有两个值需要我们人为定义，一个是数据集的划分，另外就是k值的确定了，数据集的划分这里不做过多的赘述，我们主要讲一下K值的选取。分类结果过多这里只展示，最后一部分。

2025-03-23 17:26:31 361

原创 Windows上安装Anaconda3教程

Anaconda快速安装教程。

2025-03-10 08:45:19 1578

2301_79631138的博客