自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 了解PCA

主成分分析(Principal Component Analysis,PCA)是一种常用的无监督降维方法,通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量(主成分),转换后的这组变量称为主成分。

2025-06-17 01:28:10 346

原创 支持向量机(SVM)

支持向量机(Support Vector Machine, SVM)是一种经典的监督学习算法,广泛应用于分类和回归任务。它以强大的数学基础和高效的特征空间处理能力著称,尤其适合小样本、高维度的数据场景。:SVM的目标是找到一个最优超平面(决策边界),使得两类样本到该超平面的。间隔越大,模型的泛化能力越强。:决定超平面位置的关键样本点,即位于间隔边界上的样本。这些向量是训练集中的“关键元素”。:wTx+b=0wTx+b=0,其中 ww 是法向量,bb 是偏置。

2025-06-02 21:46:37 1925

原创 机器学习---逻辑回归

1.逻辑回归(Logistic Regression)也称作 Logistic 回归分析,是一种广义的线性回归分析模型,属于机器学习中的监督学习。它实际上主要是用来解决二分类问题。通过给定的 组数据(训练集)来训练模型,并在训练结束后对给定的一组或多组数据(测试集)进行分类,其中每一组数据都是由 个指标构成。

2025-05-19 22:21:19 1571

原创 基于朴素贝叶斯分类器的西瓜好坏判断

通过计算给定特征值下好瓜和坏瓜的条件概率,并乘以先验概率,分类器得到了后验概率,即给定特征值下西瓜是好瓜或坏瓜的概率。朴素贝叶斯分类器在西瓜分类实验中表现出了良好的性能,它的简单性和有效性使其成为解决实际问题中的一个有价值的工具。首先,它初始化了后验概率的对数(posterior_prob_good和posterior_prob_bad),然后遍历测试集的特征,计算每个特征的条件概率,并更新后验概率的对数。其中,P(Y∣X) 是在已知特征 X 的条件下,类别 Y 发生的概率,也称为后验概率;

2025-05-05 20:53:02 736

原创 机器学习——决策树

优点简单易理解:决策树的结构类似于人类的决策过程,具有很好的可解释性。可以通过树状图直观地展示决策过程和规则,易于理解和解释。非线性关系:决策树能够处理线性和非线性关系,不要求数据线性可分。通过分裂节点,决策树可以捕捉复杂的模式和关系。特征选择:决策树可以自动进行特征选择,重要特征会被优先分裂,提高了模型的性能和效率。处理缺失值:决策树在处理缺失值时具有一定的鲁棒性,能够有效地处理部分缺失的数据。

2025-04-21 22:38:07 827

原创 PR曲线和ROC曲线

这次实验学习了PR曲线和ROC曲线,包括它们的定义、作用,并学会了如何绘制他们,这两种曲线与我们的生活息息相关。

2025-04-07 17:20:14 878

原创 机器学习KNN算法(基于K近邻算法的分类器的实现)

本次实验为经典的海伦约会实验,在学习了KNN算法的基础上,选择样本数据集中前k个最相似的数据,就是KNN算法中k的出处。k值较小,那么预测的标签比较容易受到样本的影响。我们很容易发现,当计算样本之间的距离时数字差值最大的属性对计算结果的影响最大,也就是说,每年获取的飞行常客里程数对于计算结果的影响将远远大于上表中其他两个特征-玩视频游戏所耗时间占比和每周消费冰淇淋公斤数的影响。该网站现在需要尽可能向海伦推荐她喜欢的人,需要我们设计一个分类器,根据用户的以上三种特征,识别出是否该向海伦推荐。

2025-03-24 21:45:47 1986

原创 机器学习实验一(Anaconda的安装)

Anaconda 是一个用于数据科学和。

2025-03-10 22:11:44 424

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除