- 博客(9)
- 收藏
- 关注
原创 Hadoop 核心技术学习心得:探索大数据处理的奇妙之旅
YARN(Yet Another Resource Negotiator)是 Hadoop 2.0 引入的一种新的资源管理系统,它负责管理集群中的计算资源,并为各种应用程序分配资源。YARN 的主要功能包括:资源管理、任务调度和应用程序管理。它将资源管理和任务调度从 MapReduce 中分离出来,使得 Hadoop 可以支持多种不同类型的计算框架,如 MapReduce、Spark、Flink 等,实现了资源的统一管理和共享。
2024-12-25 23:56:16
1020
原创 《数据可视化项目实践心得:从理论到实战的全方位解析》
这个项目主要是对一些销售数据进行可视化分析,以更好地了解销售情况和趋势。我们使用了多种工具和技术来实现这个目标。通过这个项目,我不仅掌握了数据可视化的基本原理和方法,还熟练运用了多种工具和技术,如pymysqlFlaskecharts等。在实际操作过程中,我也遇到了一些问题,例如数据库连接错误、数据格式不一致等,但通过不断地调试和学习,我最终成功地完成了项目。这个项目让我深刻体会到数据可视化在实际应用中的重要性,它可以帮助我们更直观地理解数据,从而做出更准确的决策。
2024-10-25 18:21:22
882
原创 《DBSCAN 密度聚类算法实践:原理、应用与效果对比》
从 DBSCAN 的聚类结果图可以看出,它能够更好地识别数据的分布模式,聚类效果相对 K-Means 来说更加符合我们对数据的直观理解。接下来,我们使用 K-Means 聚类模型来对数据进行聚类,设置聚类数为 4,随机数种子为 9。从 K-Means 的聚类结果图可以看出,其聚类结果不太符合我们的肉眼直觉,效果不是很好。因为没有现成的数据,我们还需要自己生成数据,所以要引入。方法生成圈圈数据,数据量为 1000,内外圈比例为 0.2,噪音为 0.05。的位置,群集标准差是 0.1,随机数设定是 5。
2024-10-23 15:09:34
346
1
原创 我的Java学习之旅:心得与收获
作为一名Java学习者,我已经在这个语言的世界里探索了一段时间。在这段旅程中,我收获了许多宝贵的经验和知识。在这里,我想分享一下我的Java学习心得和收获。
2024-06-25 10:10:18
1442
原创 使用Python进行衣服尺码预测分析(数据挖掘)第二版
使用Python进行逻辑回归和决策树分类分析在今天的数字化世界中,数据分析和机器学习模型在解决复杂问题方面扮演着至关重要的角色。在本文中,我们将通过一个实际的案例来学习如何使用Python中的`pandas`和`sklearn`库来分析衣服尺码数据,并使用逻辑回归和决策树分类模型来预测衣服的尺码。
2024-06-20 11:35:22
433
原创 使用Python进行衣服尺码预测分析(数据挖掘)
在今天的文章中,我们将通过一个实际的案例来学习如何使用Python进行数据分析和机器学习模型的构建。我们的目标是根据身高和体重数据预测衣服的尺码。我们将使用逻辑回归和决策树两种不同的机器学习模型来完成这个任务。
2024-06-20 10:31:24
543
原创 MongoDB副本集部署(Windows)
MongoDB副本集介绍:MongoDB的副本集是一组维护相同数据集的MongoDB服务器,提供高可用性和数据冗余。副本集有一个主节点(primary)和多个从节点(secondary),当主节点出现故障时,从节点可以通过选举一个新的主节点来保持服务的高可用性。
2024-06-18 10:49:39
952
原创 MongoDB分片部署(Windows)
重新打开mongodb服务,即可像原来一样使用,但是数据存储方式和原来已经不一样了,变成了分布式的分片存储。至此,mongodb分片部署就完成了!
2024-06-18 10:29:37
1764
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人