- 博客(7)
- 收藏
- 关注
原创 主成分分析(PCA)
主成分分析(PCA,Principal Component Analysis)是一种统计技术,用于简化数据集的复杂性。它通过将数据投影到一组正交的“主成分”上来实现降维。这些主成分是数据方差最大的方向,并且彼此独立。PCA不仅减少了维度,还保留了数据中最重要的变异信息。主成分分析(PCA)是一种有效的降维技术,用于简化高维数据并揭示其主要结构。在处理鸢尾花数据集的案例中,PCA能够将四维数据降维到二维,同时保留了数据中重要的类别信息。
2024-06-18 17:59:07
2157
1
原创 支持向量机(SVM)
支持向量机(Support Vector Machine,简称SVM)是一种用于分类和回归分析的监督学习模型。SVM通过在特征空间中寻找一个最佳的分离超平面,以最大化类间间隔,实现对数据的分类。
2024-06-11 18:19:31
2500
原创 逻辑回归(Logistic Regression)
优点实现简单,易于理解和解释。计算代价低,训练速度快。输出结果具有概率意义,可以对不同类别的预测概率进行解释。缺点假设输入特征线性可分,对非线性数据拟合能力有限。无法处理复杂的关系,如特征之间的高阶交互作用。
2024-05-28 18:04:32
632
原创 朴素贝叶斯分类器的学习及初实验
朴素贝叶斯分类器是一种简单而强大的机器学习算法,常用于文本分类、垃圾邮件过滤、情感分析等任务。它基于贝叶斯定理,假设特征之间相互独立,因此称为“朴素”。
2024-05-14 16:48:36
633
1
原创 knn算法的简单实践及分类模型评估指标(以knn算法为例)
K最近邻(K-Nearest Neighbors,简称KNN)是一种基本的分类和回归方法,它的原理简单而直观。在KNN算法中,对于一个未知样本,通过测量它与训练集中的所有样本的距离,然后选择距离最近的K个样本,根据它们的标签来确定该样本的类别。
2024-04-16 16:18:42
3557
原创 [作业]knn算法的学习和初实践
一般是通过交叉验证(将样本数据按照一定比例,拆分出训练用的数据和验证用的数据,比如6:4拆分出部分训练数据和验证数据),从选取一个较小的K值开始,不断增加K的值,然后计算验证集合的方差,最终找到一个比较合适的K值。欧几里得距离是我们在平面几何中最常用的距离计算方法,即两点之间的直线距离。中最简单的方法之一。所谓K最近邻,就是K个最近的邻居的意思,说的是每个样本都可以用它最接近的K个邻近值来代表。2.曼哈顿距离:KNN算法通常的距离测算方式为欧式距离和曼哈顿距离,相比之下欧氏距离会更常用欧式距离公式。
2024-04-02 06:32:39
301
1
原创 安装Python环境
2.安装anaconda后在命令行操作安装Python。3.查询Python版本号,出现即安装成功。4·在官网下载并安装VS code。1·下载anaconda。
2024-03-11 14:02:02
331
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅