- 博客(7)
- 收藏
- 关注
原创 数据可视化中Flask框架
Flask 诞生于 Python 社区,秉持着 “小而美” 的设计理念,核心代码短小精悍,功能却不容小觑。它紧紧遵循 WSGI(Web Server Gateway Interface)这一 Web 应用规范,为 Python 开发者开辟了一条轻装上阵的 Web 开发通道。与 Django 相较,Django 仿若一座设施完备的现代化都市,内置数据库、表单系统、管理后台诸多模块,一应俱全;
2024-12-09 14:23:20
1013
原创 Hadoop集群的搭建和配置
通过以上详细的步骤,我们成功地搭建并配置了 Hadoop 集群。在实际应用中,还可以根据具体的业务需求和数据特点进一步优化集群的配置,如调整资源分配策略、优化存储格式、设置数据压缩等。同时,还需要关注集群的性能监控和故障排查,以确保集群能够稳定、高效地运行。希望本文能够为广大读者在 Hadoop 集群搭建与配置的学习和实践过程中提供全面、深入的参考和帮助,让大家能够顺利地开启大数据处理的征程。
2024-11-27 15:17:54
1125
原创 大数据分析与应用之数据挖掘中的关联规则
Apriori算法的基本思想是:首先找到所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小置信度。然后使用前一步找到的频集产生期望的规则,产生只包含集合的项的所有规则,一旦这些规则被生成,那么只有那些大于用户给定的最小置信度的规则才被留下来。为了生成所有频集,使用了递推的方法。可能产生大量的候选集,以及可能需要重复扫描数据库,是Apriori算法的两大缺点。
2024-11-06 00:10:48
940
原创 python数据分析之pandas统计分析基础
统计分析是数据分析的重要组成部分,它几乎贯穿了整个数据分析的流程。运用统计方法,将定量问题与定性问题结合进行的研究活动叫作统计分析。统计分析除了包含单数值型特征的数据集中趋势、离散趋势和峰度与偏度等统计知识外,还包含多个特征间的比较计算等知识。以下将介绍使用pandas库进行统计分析所需要掌握的基本知识。
2024-06-23 22:24:17
1861
原创 MongoDB基本操作
MongoDB是属于NoSql的一种数据类型。MongoDB是一款强大、灵活、且易于扩展的通用型数据库。MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨再为WEB引用提供可扩展的高性能数据存储解决方案,将数据存储为一个文档(类似JSON对象),数据结构由键值(key=>value)对组成支持丰富的查询表达,可以设置任何属性的索引;支持副本集、分片。它是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。
2024-06-18 21:14:50
1587
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人