- 博客(8)
- 收藏
- 关注
原创 机器学习中的PCA降维
主成分分析(Principal Component Analysis, PCA)作为一种经典的降维技术,能够有效地将高维数据投影到低维空间,同时保留数据的主要特征。本文将详细介绍PCA的数学原理、Python实现方法,并分析其优缺点,帮助读者全面理解并正确应用这一强大的降维技术。PCA的核心思想是通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量(主成分),这些主成分按照方差从大到小排列。第一个主成分对应于数据方差最大的方向,第二个主成分对应于与第一个主成分正交且方差次大的方向,以此类推。
2025-06-17 13:46:32
1817
原创 基于SVM的垃圾邮件分类
1. 什么是支持向量机(SVM)支持向量机(Support Vector Machine)是一种二分类监督学习算法,主要用于分类问题,也可以通过扩展用于回归。它的基本目标是: 在特征空间中找到一个最优的超平面,将正类和负类分开,并最大化两类样本到这个超平面的距离。2. 几何解释:最优超平面与间隔假设我们在二维空间中进行分类,正类和负类可以用一条直线(超平面)分开。SVM 不仅要找到能分开两类的数据的“任意一条线”,而是要找到“离两类样本最远”的那一条。这样的分界线就是最优超平面。
2025-06-03 18:09:31
1728
原创 Logistic回归模型实现
3.1 核心实现要点算法本质:实现了二分类Logistic回归,通过Sigmoid函数将线性输出映射为概率(0-1)关键公式优化方法:批量梯度下降(BGD),每次迭代使用全部样本更新参数3.2 代码优势从零实现不依赖scikit-learn的现成LogisticRegression类清晰展示梯度下降和参数更新过程可视化完整决策边界:直观展示模型分类能力损失曲线:监控训练收敛情况混淆矩阵:量化分类错误类型评估全面包含准确率、精确率、召回率、F1值等指标3.3关键参数影响3.4 学习建议尝试调整。
2025-05-20 19:32:53
352
原创 朴素贝叶斯算法详解:原理、实现与应用
朴素贝叶斯(Naive Bayes)是一种基于贝叶斯定理的简单概率分类算法,以其高效、易于实现的特点在文本分类、垃圾邮件过滤等领域广泛应用。朴素贝叶斯算法虽然简单,但在许多实际应用中表现出色,特别是在文本分类领域。理解其数学原理有助于更好地调参和优化。当特征独立性假设基本满足时,朴素贝叶斯往往能提供令人惊讶的良好表现。
2025-05-06 16:18:38
1336
原创 决策树算法原理与实现
决策树是一种常用的机器学习算法,它通过树状结构对数据进行分类或回归。本文详细介绍了决策树的基本原理,包括特征选择、树的构建和剪枝策略,并使用Python的scikit-learn库实现了完整的决策树分类器。文章还探讨了决策树的优缺点及适用场景,并提供了可视化方法帮助理解模型。关键词:决策树、ID3、C4.5、CART、机器学习。
2025-04-21 21:05:34
1648
原创 k邻近算法的分类器的实现
K近邻(K-Nearest Neighbors, KNN)是一种基于实例的监督学习算法,主要用于分类和回归任务。相似的对象在特征空间中彼此靠近。对于一个待分类的样本,通过计算其与训练集中所有样本的距离,找到距离最近的K个邻居,根据这K个邻居的类别进行投票决策。
2025-03-24 18:07:38
896
原创 Anaconda3 安装和使用
Anaconda3 是一个流行的 Python 发行版本,包含大量的科学计算、数据分析和机器学习相关的库,如 NumPy、Pandas、Matplotlib、Scikit-learn 和 TensorFlow 等。它还内置了 Conda 这个强大的包管理和环境管理工具,使开发者可以轻松管理 Python 版本。
2025-03-10 11:54:40
560
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅