- 博客(6)
- 收藏
- 关注
原创 使用SVM建立垃圾邮件过滤器
使用SVMs建立自己的垃圾邮件过滤器。首先需要将每个邮件x变成一个n维的特征向量,并训练一个分类器来分类给定的电子邮件x是否属于垃圾邮件(y=1)或者非垃圾邮件(y=0)。数据集:emailSample1.txt, vocab.txt, spamTrain.mat, spamTest.mat。训练集,一共4000个样本。测试集,1000个样本。
2025-06-02 20:29:54
277
原创 Logistic回归:数学原理与Python实现详解
Logistic回归是一种用于解决分类问题的统计方法,尤其适用于二分类问题。它通过使用逻辑函数(也称为Sigmoid函数)将线性回归的输出映射到0和1之间,从而预测某个事件发生的概率。Logistic回归的核心思想是通过最大似然估计来拟合模型参数,使得预测概率与实际标签尽可能一致。Logistic回归是一种简单但有效的分类算法,特别适用于二分类问题。通过使用Sigmoid函数,Logistic回归能够将线性回归的输出转换为概率值,从而进行分类预测。
2025-05-19 20:13:10
295
原创 决策树:从理论到实践
决策树是一种监督学习算法,常用于分类和回归任务。它通过一系列的问题来划分数据集,从而逐步缩小可能的类别范围,直到达到某个终止条件(例如所有样本属于同一类)。
2025-04-21 17:08:01
251
原创 ROC曲线
ROC 曲线(Receiver Operating Characteristic Curve,受试者工作特征曲线)是一种广泛用于评估二分类模型性能的工具。它通过展示模型在不同分类阈值下的表现,帮助我们更好地理解模型的能力。本文将介绍 ROC 曲线的基本概念,并使用 Python 代码绘制一个实际的 ROC 曲线。
2025-03-31 20:52:54
329
原创 基于K近邻算法的分类器的实现
我们很容易发现,当计算样本之间的距离时数字差值最大的属性对计算结果的影响最大,也就是说,每年获取的飞行常客里程数对于计算结果的影响将远远大于上表中其他两个特征-玩视频游戏所耗时间占比和每周消费冰淇淋公斤数的影响。现需要实现将一个待分类样本的三个特征值输入程序后,能够识别该样本的类别,并且将该类别输出。该网站现在需要尽可能向海伦推荐她喜欢的人,需要我们设计一个分类器,根据用户的以上三种特征,识别出是否该向海伦推荐。其中输入数据应包含三个值,输出应为喜欢,一般,不喜欢,三个中的一个。
2025-03-24 21:21:41
833
原创 在Windows中下载并安装Anaconda
按下键盘上的win+Q,打开搜索框,搜索anaconda Prompt并打开输入代码并回车如果显示版本号则安装成功。
2025-03-02 17:02:06
578
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人