- 博客(8)
- 收藏
- 关注
原创 Hive介绍与环境搭建
Hive 是基于Hadoop的一个数据仓库工具,它使用MapReduce计算框架(Hive在未来版本中将逐渐抛弃ManReduce,并转移到Spark等计算框架上)实现了常用SOL语句,关对外提供类SQL编程接口。MapReduce编程技术学习成本较高,应用较为复杂,业界人员又大多习惯使用SQL语言来处理数据。在这种情况下,Hive的出现降低了Hadoop的使用门槛,减少了开发MapReduce程序的时间成本,为用户、开发人员和科研人员提供了极大的方便。
2024-04-17 15:16:41
1749
2
原创 Hbase的安装与实践(一)
HBase是一个分布式的、面向列的开源,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
2024-04-09 20:30:35
1092
原创 ZooKeeper的安装与操作
是一个分布式的、开放源码的分布式应用程序协调服务,它是的Chubby服务的开源实现,也是和等大数据生态系统中的重要组件。ZooKeeper的目标是为分布式应用提供一致性服务,包括配置维护、域名服务、分布式同步和组服务等。它封装了复杂且易出错的关键服务,通过简单的接口和高效、稳定的系统提供给用户。ZooKeeper的工作原理基于,该算法通过选举产生一个领导者(leader),只有领导者能提交proposer,以此来解决Paxos算法中可能存在的活锁问题。
2024-04-03 12:59:08
3330
2
原创 没有基础?来这里看看,Python必做题(第3天)超级适合新手!!!!y
目录一.链表1.建立链表类实现链表的插入,增加,查找,删除,查看长度和打印的方法。链表的介绍如下: 链表是一种物理存储单元上非连续、非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接次序实现的。链表中每一个元素称为结点,链表由一系列结点组成,结点可以在运行时动态生成。链表的每个结点包括两个部分:一个是存储数据元素的数据域,另一个是存储下一个结点地址的指针域。本次挑战中,你需要在 linkedlist.py 文件中补充类 Node 和类 LinkedList 的空缺部分。代码如下:
2024-01-28 10:00:00
403
1
原创 没有基础?来这里看看,Python必做题(第2天)超级适合新手!!!!
【代码】没有基础?来这里看看,Python必做题(第2天)超级适合新手!!!!
2024-01-27 18:35:41
447
1
原创 没有基础?来这里看看,Python必做题(第1天)超级适合新手!!!!
挑战介绍:实现一个算法来识别一个字符串的字符是否是唯一的。挑战内容:本次挑战中,你需要在 unique_chars.py 文件中补充函数 has_unique_chars 的空缺部分。 has_unique_chars 函数接受一个参数,string 用于指定传入的字符串; has_unique_chars 函数输出一个布尔值,即 True 或者 False。 你需要补充 has_unique_chars 函数,使其可以识别传入的 string 字符串的字
2024-01-26 19:47:08
923
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人