Hutudan_xi-优快云博客

原创主成分分析 PCA

PCA是一种广泛应用的降维技术，具有一系列优点和缺点。在实际应用中，选择使用PCA需要根据具体问题的特点和数据的性质，综合考虑其优缺点。正确使用PCA能够有效提高数据处理的效率和模型的性能。

2025-06-04 20:18:07 666

原创支持向量机

本次实验中，我尝试实现了一个简单的支持向量机（SVM）模型。总的来说，本次实验使我更好地理解了支持向量机的基本原理和实现过程，实现能够对线性可分数据进行分类的SVM算法模型。

2025-06-02 17:06:32 261

原创逻辑回归算法

本次实验我们学习了对逻辑回归算法的具体实现，逻辑回归应用于分类问题，常用于二分类问题。逻辑回归的目的就是找到Sigmoid函数的最佳拟合参数，求解最佳拟合参数的过程可以通过最优化算法实现，最优化算法有很多种，比如梯度上升、梯度下降等等。

2025-05-19 16:05:52 373

定义及加载数据集，分为训练集和待测集，返回样本所具有的属性。#加载数据集函数#训练集dataSet=[['青绿','蜷缩','浊响','清晰','凹陷','硬滑',0.697,0.460,'好瓜'],['乌黑','蜷缩','沉闷','清晰','凹陷','硬滑',0.774,0.376,'好瓜'],['乌黑','蜷缩','浊响','清晰','凹陷','硬滑',0.634,0.264,'好瓜'],['青绿','蜷缩','沉闷','清晰','凹陷','硬滑',0.608,0.318,'好瓜'],

2025-05-05 18:23:48 1750

原创决策树算法

信息熵是信息论中的核心概念，用于度量随机变量的混乱程度。通俗地说，一个系统的信息熵越高，其包含的信息量越 “混乱”，预测其结果的难度越大；反之，信息熵越低，系统越 “纯净”，结果越容易预测。ID3 算法逻辑简单，适合作为决策树入门案例，但在实际应用中受限于特征类型和偏向性问题。C4.5 算法通过信息增益率、连续特征处理和剪枝策略，更适用于真实数据集，是传统决策树算法中的优选方案。

2025-04-21 15:27:21 1964

原创 kNN算法分类模型评估

模型复杂度高，PR与ROC曲线均显示出较高的AUC值（接近1），但可能存在过拟合风险。AUC值较高且稳定，平衡了偏差与方差，体现出较好的分类性能。模型趋向平滑，AUC值略有下降，泛化能力增强，但可能因欠拟合丢失局部特征信息。

2025-04-07 17:56:22 2117

原创 k-近邻算法

kNN算法是一种简单而有效的机器学习算法，无需训练过程，直接利用训练数据进行预测，应用场景广泛。总之，KNN就是基于“物以类聚，人以群分”的简单粗暴的想法来进行分类的。

2025-03-19 20:48:07 923

原创 Anaconda安装

（由于官网是外网，下载时速度较慢，这里推荐使用清华大学镜像源这里有许多版本，大家根据需求选择即可。

2025-03-04 18:54:08 640 1

Hutudan_xi的博客