自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 主成分分析 PCA

PCA是一种广泛应用的降维技术,具有一系列优点和缺点。在实际应用中,选择使用PCA需要根据具体问题的特点和数据的性质,综合考虑其优缺点。正确使用PCA能够有效提高数据处理的效率和模型的性能。

2025-06-04 20:18:07 666

原创 支持向量机

本次实验中,我尝试实现了一个简单的支持向量机(SVM)模型。总的来说,本次实验使我更好地理解了支持向量机的基本原理和实现过程,实现能够对线性可分数据进行分类的SVM算法模型。

2025-06-02 17:06:32 261

原创 逻辑回归算法

本次实验我们学习了对逻辑回归算法的具体实现,逻辑回归应用于分类问题,常用于二分类问题。逻辑回归的目的就是找到Sigmoid函数的最佳拟合参数,求解最佳拟合参数的过程可以通过最优化算法实现,最优化算法有很多种,比如梯度上升、梯度下降等等。

2025-05-19 16:05:52 373

原创 朴素贝叶斯分类器

定义及加载数据集,分为训练集和待测集,返回样本所具有的属性。#加载数据集函数#训练集dataSet=[['青绿','蜷缩','浊响','清晰','凹陷','硬滑',0.697,0.460,'好瓜'],['乌黑','蜷缩','沉闷','清晰','凹陷','硬滑',0.774,0.376,'好瓜'],['乌黑','蜷缩','浊响','清晰','凹陷','硬滑',0.634,0.264,'好瓜'],['青绿','蜷缩','沉闷','清晰','凹陷','硬滑',0.608,0.318,'好瓜'],

2025-05-05 18:23:48 1750

原创 决策树算法

信息熵是信息论中的核心概念,用于度量随机变量的混乱程度。通俗地说,一个系统的信息熵越高,其包含的信息量越 “混乱”,预测其结果的难度越大;反之,信息熵越低,系统越 “纯净”,结果越容易预测。ID3 算法逻辑简单,适合作为决策树入门案例,但在实际应用中受限于特征类型和偏向性问题。C4.5 算法通过信息增益率、连续特征处理和剪枝策略,更适用于真实数据集,是传统决策树算法中的优选方案。

2025-04-21 15:27:21 1964

原创 kNN算法分类模型评估

模型复杂度高,PR与ROC曲线均显示出较高的AUC值(接近1),但可能存在过拟合风险。AUC值较高且稳定,平衡了偏差与方差,体现出较好的分类性能。模型趋向平滑,AUC值略有下降,泛化能力增强,但可能因欠拟合丢失局部特征信息。

2025-04-07 17:56:22 2117

原创 k-近邻算法

kNN算法是一种简单而有效的机器学习算法,无需训练过程,直接利用训练数据进行预测,应用场景广泛。总之,KNN就是基于“物以类聚,人以群分”的简单粗暴的想法来进行分类的。

2025-03-19 20:48:07 923

原创 Anaconda安装

(由于官网是外网,下载时速度较慢,这里推荐使用清华大学镜像源这里有许多版本,大家根据需求选择即可。

2025-03-04 18:54:08 640 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除