- 博客(12)
- 收藏
- 关注
原创 【机器学习】主成分分析(PCA)技术对鸢尾花数据集进行降维
本实验通过主成分分析(PCA)技术对鸢尾花数据集进行降维,旨在:使用PCA将原始4维数据降到2维,并进行可视化。分析降维前后数据的分布和类别区分情况。评估PCA对数据方差解释率的贡献,以便在最少维度中保留最多信息。
2024-12-05 17:19:22
1186
1
原创 【机器学习】SVM对Iris鸢尾花数据集实现多分类
本文利用Scikit-learn库构建和训练SVM分类器对鸢尾花数据集进行分类,并评估其在分类任务中的表现。
2024-11-21 16:57:40
1411
1
原创 【机器学习】利用逻辑回归对iris鸢尾花数据集进行分类
本文基于鸢尾花数据集(Iris Dataset)完成了一个二分类任务。为了简化任务,将其转化为二分类问题。文章首先对数据进行预处理,包括划分训练集和测试集以及对特征进行标准化处理,随后,使用逻辑回归模型(Logistic Regression)对数据进行训练,并基于测试集进行预测,最后对模型进行性能评估。
2024-11-20 17:11:19
1844
原创 【机器学习】利用KNN对Iris鸢尾花数据集进行分类
本文总结实现KNN分类的完整步骤,通过使用Scikit-learn库利用KNN对Iris鸢尾花数据集进行分类,直观感受调整超参数对模型性能的影响,并提供从加载数据到模型训练、评估以及可视化的完整流程。
2024-11-13 17:28:44
2043
原创 【机器学习】朴素贝叶斯对fetch_20newsgroups数据集进行分类实现
本文使用Scikit-learn对20 Newsgroups数据集进行分类,采用了朴素贝叶斯方法。首先,数据被分为训练集和测试集,并通过CountVectorizer转换为数值特征。比较了三种朴素贝叶斯模型:多项式朴素贝叶斯(MultinomialNB)、高斯朴素贝叶斯(GaussianNB)和伯努利朴素贝叶斯(BernoulliNB)。每种模型都在训练集上进行训练,并在测试集上进行预测。评估指标包括准确率、分类报告和混淆矩阵,以衡量模型性能。
2024-11-07 17:39:54
1211
1
原创 【分布式】Zookeeper分布式安装部署
本文介绍了zookeeper完全分布式的搭建,基于hadoop集群,在三台机器上部署zookeeper。
2024-11-01 20:28:43
1018
原创 【分布式】Hadoop完全分布式的搭建(零基础)
本文旨在指导读者如何在虚拟化环境中构建一个完全分布式的Hadoop集群。内容涵盖了从网络和节点的规划到环境设置,再到实现SSH免密登录、配置文件的准备、软件的分发与安装、集群的启动与停止。
2024-10-28 19:30:10
3315
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人