自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 主成分分析法(PCA)

主成分分析(Principal Component Analysis, PCA)是一种广泛应用于数据降维、特征提取和可视化的无监督学习方法。其核心目标是通过线性变换将高维数据投影到低维空间,同时保留数据的主要信息(方差最大),从而简化数据结构、减少计算复杂度并抑制噪声。1. PCA的核心思想数据降维:将原始数据从高维空间(如100维)映射到低维空间(如2维或3维),同时尽可能保留数据的方差(信息)。最大化方差。

2025-06-16 18:26:19 1029

原创 基于SVMs的垃圾邮件分类器

SVM是一种强大的分类算法,尤其适用于高维稀疏数据(如文本分类)。其核心思想是通过最大化间隔和引入核技巧,实现高效且鲁棒的分类。在实际应用中,需根据数据特点选择合适的核函数和参数,并通过交叉验证优化性能。对于垃圾邮件分类任务,线性SVM通常是首选,因其速度快且在高维稀疏数据上表现优异。如果数据存在复杂非线性关系,可以尝试RBF核,但需注意计算开销和过拟合风险。

2025-06-02 19:30:46 428

原创 逻辑回归模型实现

其核心思想是通过线性回归模型预测的结果,利用逻辑函数(如Sigmoid函数)将输出映射到0到1之间的概率值,从而实现对样本类别的预测。逻辑回归(Logistic Regression)是一种经典的统计学习方法,尽管名字中带有“回归”,但它本质上是一种用于解决。逻辑回归凭借其简洁性和可解释性,仍是工业界和学术界的常用工具,尤其在需要透明决策的场景(如医疗、金融)中不可替代。:线性回归直接输出连续值,无法直接用于分类任务(如判断邮件是否为垃圾邮件)。其中,z=wTx+b(w为权重,b为偏置,x为输入特征)。

2025-05-19 21:06:38 552

原创 朴素贝叶斯分类

朴素贝叶斯是一种基于概率的简单分类算法,其核心在于。

2025-05-05 19:39:48 737

原创 决策树(ID3、CART)

决策树是一种简单且直观的算法,但容易过拟合,通常需要结合剪枝或集成方法(如随机森林、GBDT)来提高性能。ID3适合小规模分类任务,但无法处理连续特征。CART是更通用的算法,支持分类和回归,且能处理连续特征,是现代决策树算法的基础。

2025-04-21 18:33:06 923

原创 KNN算法分类模型评估

分类模型评估是模型开发的核心环节,通过混淆矩阵和各种评估指标,我们可以全面了解模型的性能。在实际应用中,需要根据任务需求和数据特点选择合适的评估方法,并关注类别不平衡问题。通过持续的评估和优化,可以提升模型的实用性和可靠性。

2025-04-07 20:12:58 704

原创 KNN算法应用实例——海伦约会配对

KNN算法是一种基于实例的学习方法,根据离待分类样本最近的k个训练样本的类别来确定待分类样本的类别。是一种简单而有效的分类算法,适用于小规模数据集和多分类问题。

2025-03-24 19:54:01 923

原创 anaconda安装及环境配置

1、创建虚拟环境:并输入以下代码。自此,anaconda下载完毕。以上anaconda安装完成。

2025-03-10 19:24:56 743

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除