自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 机器学习——PCA

主成分分析(Principal Component Analysis, PCA)是一种通过线性变换实现数据降维的技术。其核心目标是将原始数据映射到一个新的坐标系中,使得映射后的数据方差最大化,从而保留最重要的信息。PCA的关键在于提取数据的主成分,并将数据投影到这些主成分上,以达到降维的目的。

2025-06-10 00:22:25 1015

原创 支持向量机(SVM)

垃圾邮件过滤是文本分类的一个经典应用。我们的目标是:将每封电子邮件转换为n维特征向量训练一个分类器(y=1表示垃圾邮件,y=0表示非垃圾邮件)评估模型的性能。

2025-06-03 19:14:28 379

原创 Logistic回归

logistic回归属于概率型非线性回归与直线回归的区别:线性回归的因变量y是连续性数值型变量,不能是分类变量。logistic回归是研究二分类、多分类、有序多分类(等级资料)观察结果(因变量)与一些影响因素(自变量)之间的关系。如因变量:食管癌发生,一个二分类变量;

2025-05-19 23:12:03 1365

原创 朴素贝叶斯算法

通过对这个好坏瓜分类器系统我了解到了朴素贝叶斯分类器的结构非常直观,易于理解,这使得它在很多领域都有广泛的应用。同时,也需要注意朴素贝叶斯算法对特征独立性的假设,这可能会降低模型的准确性。

2025-05-06 00:46:41 867

原创 机器学习—决策树

决策树是一种基于树形结构的监督学习算法,通过一系列规则(if-then条件)对数据进行分类或回归。:包含完整数据集的最顶层节点:表示特征测试的分支决策点:最终的分类/回归结果(分类树):使用(Information Gain)选择特征信息增益=H(D)−H(D∣A)信息增益=H(D)−H(D∣A)其中 H(D)H(D) 是数据集的经验熵改进ID3,采用(Gain Ratio)避免偏向多值特征增益率=信息增益特征固有值增益率=特征固有值信息增益​(分类与回归):分类:使用回归:最小化。

2025-04-21 21:19:25 1005

原创 knn算法性能度量以及ROC曲线,PR曲线的绘制

通过绘制ROC和PR曲线进行性能评估,我们能够更全面地理解模型在不同情况下的表现,尤其是针对类别不平衡的场景。ROC曲线更适合评估整体性能,特别是当数据较为均衡时,而PR曲线则在类别不平衡时更具优势。通过对比这些曲线,我们可以为不同应用场景选择合适的评估标准,进而优化模型的决策过程。

2025-04-07 23:10:50 674

原创 KNN(K近邻)算法以及代码实现

KNN算法是一种简单但有效的机器学习算法,适用于小规模数据集和低维空间中的分类和回归任务。然而,对于大规模数据集和高维数据,KNN的计算复杂度和性能可能会成为问题。因此,在实际应用中,需要根据具体问题选择合适的K值,并考虑数据预处理和特征选择等步骤来提高模型性能。

2025-03-24 20:55:26 1194 1

原创 Anaconda安装

一定要点击确定直到环境窗口全部确认关闭,再重复打开一次环境变量查看是否有。输入conda检查,有即可,就可以使用anaconda了。选第二个,开始安装,安装时间较长,耐心等待即可。复制这三个文件地址,复制到新建打开的窗口。点击ALL Users随后点击Next。打开搜索框,搜索环境变量,双击打开。win+r 输入cmd进入终端。点击Next>agree。等待安装包安装即可。

2025-03-06 22:40:16 372

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除