自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 使用SVM建立垃圾邮件过滤器

使用SVMs建立自己的垃圾邮件过滤器。首先需要将每个邮件x变成一个n维的特征向量,并训练一个分类器来分类给定的电子邮件x是否属于垃圾邮件(y=1)或者非垃圾邮件(y=0)。数据集:emailSample1.txt, vocab.txt, spamTrain.mat, spamTest.mat。训练集,一共4000个样本。测试集,1000个样本。

2025-06-02 20:29:54 277

原创 Logistic回归:数学原理与Python实现详解

Logistic回归是一种用于解决分类问题的统计方法,尤其适用于二分类问题。它通过使用逻辑函数(也称为Sigmoid函数)将线性回归的输出映射到0和1之间,从而预测某个事件发生的概率。Logistic回归的核心思想是通过最大似然估计来拟合模型参数,使得预测概率与实际标签尽可能一致。Logistic回归是一种简单但有效的分类算法,特别适用于二分类问题。通过使用Sigmoid函数,Logistic回归能够将线性回归的输出转换为概率值,从而进行分类预测。

2025-05-19 20:13:10 295

原创 决策树:从理论到实践

决策树是一种监督学习算法,常用于分类和回归任务。它通过一系列的问题来划分数据集,从而逐步缩小可能的类别范围,直到达到某个终止条件(例如所有样本属于同一类)。

2025-04-21 17:08:01 251

原创 ROC曲线

ROC 曲线(Receiver Operating Characteristic Curve,受试者工作特征曲线)是一种广泛用于评估二分类模型性能的工具。它通过展示模型在不同分类阈值下的表现,帮助我们更好地理解模型的能力。本文将介绍 ROC 曲线的基本概念,并使用 Python 代码绘制一个实际的 ROC 曲线。

2025-03-31 20:52:54 329

原创 基于K近邻算法的分类器的实现

我们很容易发现,当计算样本之间的距离时数字差值最大的属性对计算结果的影响最大,也就是说,每年获取的飞行常客里程数对于计算结果的影响将远远大于上表中其他两个特征-玩视频游戏所耗时间占比和每周消费冰淇淋公斤数的影响。现需要实现将一个待分类样本的三个特征值输入程序后,能够识别该样本的类别,并且将该类别输出。该网站现在需要尽可能向海伦推荐她喜欢的人,需要我们设计一个分类器,根据用户的以上三种特征,识别出是否该向海伦推荐。其中输入数据应包含三个值,输出应为喜欢,一般,不喜欢,三个中的一个。

2025-03-24 21:21:41 833

原创 在Windows中下载并安装Anaconda

按下键盘上的win+Q,打开搜索框,搜索anaconda Prompt并打开输入代码并回车如果显示版本号则安装成功。

2025-03-02 17:02:06 578

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除