自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 SVM支持向量机

SVM是一种强大的监督学习算法,主要用于分类问题。其核心思想是寻找最大间隔超平面来分隔不同类别的数据点。通过支持向量确定最优分割面,并引入软间隔处理噪声数据。对于非线性问题,可使用核技巧将数据映射到高维空间。示例展示了SVM在垃圾邮件分类中的应用,包括邮件预处理、特征提取、模型训练和评估。SVM具有高维有效性和内存高效等优点,但也存在计算复杂和参数选择困难等缺点。该算法通过平衡间隔最大化和分类准确性,实现了较好的泛化能力。

2025-05-30 11:17:21 823

原创 Logistic回归

Logistic回归是一种用于解决二分类问题的监督学习模型,属于广义线性回归分析。其核心在于Sigmoid函数,该函数将线性组合映射到(0,1)区间,用于概率估计。模型通过梯度下降法优化,通过迭代更新参数以最小化损失函数。在实际应用中,数据通常需要标准化以加速收敛。Logistic回归的训练过程包括数据加载、特征缩放、定义损失函数和梯度下降算法、初始化参数、模型训练以及结果输出与可视化。通过训练,模型能够学习到决策边界,并在测试集上评估分类准确率。Logistic回归因其简单有效,在多种分类问题中广泛应用。

2025-05-19 17:54:06 390

原创 实现朴素贝叶斯分类器

这篇博客主要介绍了朴素贝叶斯的核心思想和对不同数据类型的处理,实现了西瓜分类的朴素贝叶斯模型:利用贝叶斯公式将样本特征与类别标签的关联转化为后验概率计算,经过计算后,通过比较概率来实现分类的功能。并通过测试集,对模型的分类功能进行验证。

2025-05-05 15:28:05 952

原创 决策树算法详解

这篇博客介绍了决策树这一监督学习算法。文章首先通过一个简单的贷款审批例子,解释了决策树模拟人类决策过程的树形结构及其基本工作原理。

2025-04-20 21:19:34 689

原创 机器学习模型评估:深入解析 ROC 曲线与 PR 曲线

机器学习模型评估是确保模型在实际应用中有效性的关键步骤。通过评估,我们可以准确地判断一个模型在未见数据上的表现,避免过拟合或不足拟合的情况。模型评估不仅仅是选择正确的模型,还涉及揭示其在不同场景下的优缺点,包括对数据不平衡的敏感度、对错误分类的容忍度等。合理的评估方式帮助我们优化模型,确保其在真实世界中的工作效果,提升决策的准确性,并且指导模型的进一步改进。

2025-04-05 11:17:41 695

原创 海伦的约会配对优化指南:K近邻算法实战全解析

通过使用k-近邻算法,我们能够基于用户的兴趣特征对其进行分类,进而提高约会网站的配对准确度。通过数据归一化、KNN分类、错误率分析等步骤,系统能够智能地预测用户的兴趣类型,并且根据不同的k值优化分类效果。

2025-03-19 15:40:33 896

原创 从零开始安装 Conda 并搭建 Python 环境

是一个开源的包管理和环境管理系统,最初由 Anaconda 公司开发,主要用于 Python 及其他语言(如 R、Ruby、Lua、Perl、Haskell、C/C++)的包管理和环境管理。例如,一个项目可能需要使用Python 3.6和某个特定版本的库,而另一个项目可能需要Python 3.8和另一个版本的库。1.如果你的项目涉及数据科学、机器学习、科学计算,推荐用 Conda,因为它的依赖管理能力更强,安装过程更稳定。这使得开发人员可以在不同的操作系统上保持一致的开发环境,减少了跨平台开发的复杂性。

2025-03-05 17:04:58 8011 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除