- 博客(8)
- 收藏
- 关注
原创 HBase 分布式数据库实验报告
NameSpace命名空间类似于关系型数据库中的database概念,每个命名空间下可以放多个表。它为表的业务划分提供了方便,有助于更好地组织和管理表。Table表类似关系型数据库中的table表概念,HBase定义表时只需要声明列族即可,不需要声明具体的列。Column列HBase中的每个列都由ColumnFamily(列族)和ColumnQualifier(列限定符)进行限定,例如infonameinfoage。建表时,只需指明列族,而列限定符无需预先定义。
2024-11-13 15:59:12
1152
原创 聚类分析实践
通过本次实验,我们不仅掌握了聚类分析的基本原理和实现方法,还通过实际编程操作加深了对聚类算法的理解。未来可以进一步探索更多聚类算法的应用场景,如文本聚类、社交网络分析等,以提升数据处理和分析的能力。
2024-10-30 21:54:25
1114
原创 绘制echarts地图和词云图
技术实现方面成功之处成功引入了 Echarts 库和相应的地图数据文件(如中国地图的china.js),实现了地图在网页上的基本展示。能够根据示例代码配置地图的一些基本属性,如显示省份名称、设置区域颜色和边框等,使地图具有一定的可读性和美观性。学会了如何将地理数据与地图进行关联,通过在data数组中设置每个地区的数据值,实现了数据在地图上的可视化呈现。例如可以根据不同的业务需求,将销售数据、人口数量等与地图的地区对应起来展示。遇到的问题及解决方法地图数据加载问题。
2024-10-27 21:40:44
978
1
原创 使用pandas进行数据预处理
Pandas是一个强大的Python数据处理库,提供了快速、灵活和富有表现力的数据结构,旨在使得“关系”或“标记”数据的操作既简单又直观。
2024-05-07 21:29:11
1294
原创 MongoDB副本集、分片综合应用
MongoDB 副部集(Secondary Replica Set)和分片(Sharding)技术是 MongoDB 中的两个重要功能,它们提供了高可用性、数据冗余和可扩展性。副部集技术用于实现数据冗余和故障转移,确保在出现故障时,系统能够继续正常运行。分片技术则用于实现数据水平拆分,提高系统的性能和可扩展性。
2024-04-23 23:24:15
1089
原创 mongodb基本操作
MongoDB数据库提供了多样性的索引支持,因此可以提高查询集合中文档的效率。若是没有索引,MongoDB数据库必须执行全集合扫描(即扫描集合中的每一个文档),从而筛选出与查询条件相匹配的文档。这种扫描全集合的查询效率是非常低的,尤其是在处理海量数据时,执行查询操作需要花费几十秒甚至几分钟的时间,这无疑对网站的性能是非常致命的。若是执行查询操作时,集合中的文档存在适当的索引,MongoDB就可以使用该索引限制必须检查的文档数量。索引是一种特殊的数据结构,即采用B-Tree数据结构。
2024-04-20 18:31:15
2771
2
原创 mongodb教程11 分片
分片(Sharding)技术是开发人员用来提高数据存储和数据读写吞吐量常用的技术之一。简单的来说,分片主要是将数据进行划分后,将它们分别存放于不同机器上的过程。通过使用分片可以实现降低单个机器的压力和处理更大的数据负载功能。分片与副本集主要区别在于,分片是每个节点存储数据的不同片段,而副本集是每个节点存储数据的相同副本。所有数据库都可以进行手动分片(Manual Sharding),因此,分片并不是MongoDB特有的。
2024-04-16 17:00:29
1229
原创 mongodb副本集群
首先登陆到主节点mongo 127.0.0.1:27017,因为只能在主节点上操作。其中第一个“id”为复制集的ID标识,即"id":“rs0”;第二个“id”是复制集内成员的标识,即"id":0。还有一种初始化的方法,就是先只初始化一个节点,然后再通过命令rs.add("ip:port") 来添加从节点或。在主节点(127.0.0.1:27017)上的test库collection集合c1中插入数据。通过命令rs.addArb("ip:port")来添加投票节点。是分别运行的MongoDB实例的端口。
2024-04-09 16:47:01
762
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人