- 博客(8)
- 收藏
- 关注
原创 机器学习:PCA主成分分析
想象你有一群在三维空间中不同位置的人,你想用一张照片(二维)尽可能地描述清楚每个人的位置和相互距离。方法,意味着在降维过程中不依赖于数据的标签信息。PCA的核心目标是。
2025-06-10 00:40:03
1027
原创 机器学习:支持向量机
使用SVMs建立自己的垃圾邮件过滤器。首先需要将每个邮件x变成一个n维的特征向量,并训练一个分类器来分类给定的电子邮件x是否属于垃圾邮件(y=1)或者非垃圾邮件(y=0)。数据集:emailSample1.txt, vocab.txt, spamTrain.mat, spamTest.mat。任务(尤其擅长二分类),也可用于回归(称为支持向量回归,SVR)。是一种强大且有理论依据的监督学习算法,主要用于。
2025-06-03 16:55:21
418
原创 机器学习:Logistic回归
Logistic回归(Logistic Regression)是一种广义线性模型(Generalized Linear Model, GLM),。(0到1之间),通过Sigmoid函数将线性回归结果映射到概率空间。(尤其是二分类)。与线性回归不同,其输出为。最小二乘法原理是通过最小化残差平方和。是由n维属性描述的样本,
2025-05-20 20:31:52
281
原创 机器学习:朴素贝叶斯算法
朴素贝叶斯算法是一种基于贝叶斯定理与特征条件独立假设的分类方法。它通过计算后验概率来进行分类,适用于文本分类、垃圾邮件过滤等场景。贝叶斯公式使用先验概率计算后验概率,公式如下:将A看成,B看成,那么贝叶斯公式可写作:其中 表示是。分类时选择使最大的类别。假设。
2025-05-06 02:34:16
928
原创 机器学习-决策树
决策树是机器学习中最直观且广泛应用的分类工具之一。它的核心思想是通过对数据特征进行递归划分,最终构建一棵树状模型,帮助我们从数据中发现分类规则。构建决策树可以使用信息增益(ID3算法)、信息增益比(C4.5算法)、基尼指数(CART算法)等方法。信息增益(ID3算法。
2025-04-22 20:29:09
562
原创 机器学习实战:k-近邻算法解决海伦约会预测问题
k-近邻算法是数据挖掘分类技术中最简单的方法之一,是最简单的机器学习算法之一。本文介绍了该算法,并通过海伦约会预测问题展示了实施该算法的基本流程。
2025-03-24 21:09:58
803
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅