- 博客(7)
- 收藏
- 关注
原创 数据可视化:用 Echarts 与 Flask 构建动态网页
Echarts 是一个基于 JavaScript 的开源可视化库,由百度开发并维护。它提供了丰富多样的可视化图表类型,包括折线图、柱状图、饼图、散点图等基础图形,以及地图、词云图、关系图等复杂图表。Echarts 的特点在于其高度的可定制性,用户可以通过详细的配置项对图表的各个方面进行精确设置,从图表的标题、坐标轴标签到数据系列的样式、交互效果等。同时,Echarts 具有良好的兼容性,能够在各种现代浏览器中稳定运行,并且支持移动端设备,为数据可视化的广泛应用提供了便利。
2024-12-09 14:19:08
932
原创 深入解析 Hadoop 核心技术:构建大数据处理基石
分布式文件系统,负责存储大规模数据,将数据分割成块并分布存储在多个节点上,具有高容错性和高可靠性。MapReduce:分布式计算模型,用于大规模数据集的并行处理。它将计算任务分解为 Map 阶段和 Reduce 阶段,通过在集群节点上并行执行来提高计算效率。:资源管理框架,负责集群资源的分配和管理,包括 CPU、内存等资源,使得不同的应用程序能够共享集群资源并高效运行。
2024-11-11 16:13:25
1099
原创 Python 在大数据应用分析中的卓越实践
它拥有丰富的库和工具,能够帮助数据科学家和分析师高效地处理、分析和可视化海量数据。例如,可以编写 Python 脚本实现数据的过滤和聚合操作,然后在 Hadoop 集群上运行。例如,使用 PySpark 读取大型数据集,进行数据转换和分析,充分利用 Spark 的分布式计算能力。在大数据环境中,Python 可以与 Hadoop、Spark 等分布式计算框架结合使用,充分发挥各自的优势,处理大规模数据集。这使得数据分析师可以将更多的精力集中在数据分析问题本身,而不是花费大量时间在代码的编写和调试上。
2024-10-31 10:29:57
1042
1
原创 Python数据分析入门(Python基础复习)
1、定义一个类:Rectangle,用来定义各种矩形。2、类中使用有参构造方法定义矩形的长和宽作为属性。3、定义“计算面积”和“计算周长”两种方法。4、创建一个矩形对象,并计算其面积和周长。# 创建矩形对象并计算面积和周长print("面积:", area)print("周长:", perimeter)类的定义:使用 class 关键字来定义一个类。# 可以在这里定义属性和方法构造方法( __init__ ):通常用于初始化对象的属性。属性: 可以是类中的变量。
2024-06-05 10:15:49
547
原创 MongoDB基本操作(Windows)
知识目标熟悉数据库和集合操作本篇目标掌握 MongoDB 的部署掌握文档的插入、更新、删除以及查询操作db.集合名.insert(JSON数据)db.集合名.remove(条件[,是否删除一条true是false否默认])也就是默认删除多条db.集合名.update(条件,新数据[,是否新增,是否修改多条])升级语法db.集合名.update(条件,{修改器:{键:值}})db.集合名.find(条件[,查询的列])
2024-04-23 15:27:30
1423
原创 MongoDB分片(windows电脑系统)
MongoDB分片部署是为了解决单个MongoDB实例存储容量有限、读写性能瓶颈等问题而设计的一种分布式数据库架构。下面是MongoDB分片部署的知识总结:1. 分片概念在MongoDB中,一个分片集群由多个节点组成,其中包括路由器节点(mongos)、配置服务器节点(config servers)和数据节点(shards)。数据会被分割成多个块(chunks),这些块会被平均地存储在不同的数据节点上。2. 分片键在进行分片之前,需要选择一个合适的字段作为分片键。
2024-04-17 10:50:34
1339
1
原创 MongoDB副本集部署(windows)
节点启动可能会遇到问题,主要检查端口是否被占用,和路径配置问题。若都没问题则考虑以管理员身份启动cmd。说明:第一个“_id”为副本集名称,“priority”为优先级,数字越大,优先级越高。每一个节点(实例)都创建对应的数据文件(data)和日志文件(log)。本教程演示mongodb4.4副本集部署(一主两从,伪分布式)(明明是主节点,但却显示从节点)1.切换到admin数据库。说明副本集群部署成功。
2024-04-09 16:56:14
676
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人