自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 数据可视化中Flask框架

Flask 诞生于 Python 社区,秉持着 “小而美” 的设计理念,核心代码短小精悍,功能却不容小觑。它紧紧遵循 WSGI(Web Server Gateway Interface)这一 Web 应用规范,为 Python 开发者开辟了一条轻装上阵的 Web 开发通道。与 Django 相较,Django 仿若一座设施完备的现代化都市,内置数据库、表单系统、管理后台诸多模块,一应俱全;

2024-12-09 14:23:20 1013

原创 Hadoop集群的搭建和配置

通过以上详细的步骤,我们成功地搭建并配置了 Hadoop 集群。在实际应用中,还可以根据具体的业务需求和数据特点进一步优化集群的配置,如调整资源分配策略、优化存储格式、设置数据压缩等。同时,还需要关注集群的性能监控和故障排查,以确保集群能够稳定、高效地运行。希望本文能够为广大读者在 Hadoop 集群搭建与配置的学习和实践过程中提供全面、深入的参考和帮助,让大家能够顺利地开启大数据处理的征程。

2024-11-27 15:17:54 1125

原创 大数据分析与应用之数据挖掘中的关联规则

Apriori算法的基本思想是:首先找到所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小置信度。然后使用前一步找到的频集产生期望的规则,产生只包含集合的项的所有规则,一旦这些规则被生成,那么只有那些大于用户给定的最小置信度的规则才被留下来。为了生成所有频集,使用了递推的方法。可能产生大量的候选集,以及可能需要重复扫描数据库,是Apriori算法的两大缺点。

2024-11-06 00:10:48 940

原创 python数据分析之pandas统计分析基础

统计分析是数据分析的重要组成部分,它几乎贯穿了整个数据分析的流程。运用统计方法,将定量问题与定性问题结合进行的研究活动叫作统计分析。统计分析除了包含单数值型特征的数据集中趋势、离散趋势和峰度与偏度等统计知识外,还包含多个特征间的比较计算等知识。以下将介绍使用pandas库进行统计分析所需要掌握的基本知识。

2024-06-23 22:24:17 1861

原创 MongoDB基本操作

MongoDB是属于NoSql的一种数据类型。MongoDB是一款强大、灵活、且易于扩展的通用型数据库。MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨再为WEB引用提供可扩展的高性能数据存储解决方案,将数据存储为一个文档(类似JSON对象),数据结构由键值(key=>value)对组成支持丰富的查询表达,可以设置任何属性的索引;支持副本集、分片。它是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。

2024-06-18 21:14:50 1587

原创 MongoDB副本集部署(windows)

每一个节点(实例)都创建对应的数据文件(data)和日志文件(log)。

2024-04-23 15:47:00 284

原创 MongoDB分片部署(windows)

OS:win11。

2024-04-22 22:28:06 1762

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除