- 博客(8)
- 收藏
- 关注
原创 主成分分析 PCA
PCA是一种广泛应用的降维技术,具有一系列优点和缺点。在实际应用中,选择使用PCA需要根据具体问题的特点和数据的性质,综合考虑其优缺点。正确使用PCA能够有效提高数据处理的效率和模型的性能。
2025-06-04 20:18:07
666
原创 支持向量机
本次实验中,我尝试实现了一个简单的支持向量机(SVM)模型。总的来说,本次实验使我更好地理解了支持向量机的基本原理和实现过程,实现能够对线性可分数据进行分类的SVM算法模型。
2025-06-02 17:06:32
261
原创 逻辑回归算法
本次实验我们学习了对逻辑回归算法的具体实现,逻辑回归应用于分类问题,常用于二分类问题。逻辑回归的目的就是找到Sigmoid函数的最佳拟合参数,求解最佳拟合参数的过程可以通过最优化算法实现,最优化算法有很多种,比如梯度上升、梯度下降等等。
2025-05-19 16:05:52
373
原创 朴素贝叶斯分类器
定义及加载数据集,分为训练集和待测集,返回样本所具有的属性。#加载数据集函数#训练集dataSet=[['青绿','蜷缩','浊响','清晰','凹陷','硬滑',0.697,0.460,'好瓜'],['乌黑','蜷缩','沉闷','清晰','凹陷','硬滑',0.774,0.376,'好瓜'],['乌黑','蜷缩','浊响','清晰','凹陷','硬滑',0.634,0.264,'好瓜'],['青绿','蜷缩','沉闷','清晰','凹陷','硬滑',0.608,0.318,'好瓜'],
2025-05-05 18:23:48
1750
原创 决策树算法
信息熵是信息论中的核心概念,用于度量随机变量的混乱程度。通俗地说,一个系统的信息熵越高,其包含的信息量越 “混乱”,预测其结果的难度越大;反之,信息熵越低,系统越 “纯净”,结果越容易预测。ID3 算法逻辑简单,适合作为决策树入门案例,但在实际应用中受限于特征类型和偏向性问题。C4.5 算法通过信息增益率、连续特征处理和剪枝策略,更适用于真实数据集,是传统决策树算法中的优选方案。
2025-04-21 15:27:21
1964
原创 kNN算法分类模型评估
模型复杂度高,PR与ROC曲线均显示出较高的AUC值(接近1),但可能存在过拟合风险。AUC值较高且稳定,平衡了偏差与方差,体现出较好的分类性能。模型趋向平滑,AUC值略有下降,泛化能力增强,但可能因欠拟合丢失局部特征信息。
2025-04-07 17:56:22
2117
原创 k-近邻算法
kNN算法是一种简单而有效的机器学习算法,无需训练过程,直接利用训练数据进行预测,应用场景广泛。总之,KNN就是基于“物以类聚,人以群分”的简单粗暴的想法来进行分类的。
2025-03-19 20:48:07
923
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1