爱欣欣.-优快云博客

原创利用Hive处理大数据实例

搭建Hive环境请看这篇文章：Hive介绍与环境搭建-优快云博客。

2024-04-24 09:53:33 1135 4

Hive 是基于Hadoop的一个数据仓库工具，它使用MapReduce计算框架(Hive在未来版本中将逐渐抛弃ManReduce，并转移到Spark等计算框架上)实现了常用SOL语句，关对外提供类SQL编程接口。MapReduce编程技术学习成本较高，应用较为复杂，业界人员又大多习惯使用SQL语言来处理数据。在这种情况下，Hive的出现降低了Hadoop的使用门槛，减少了开发MapReduce程序的时间成本，为用户、开发人员和科研人员提供了极大的方便。

2024-04-17 15:16:41 1880 2

原创 Hbase的安装与实践(二)

Hbase的介绍以及安装与配置方法详见。

2024-04-16 20:21:50 572 3

原创 Hbase的安装与实践(一)

HBase是一个分布式的、面向列的开源，该技术来源于 Fay Chang 所撰写的Google论文“Bigtable：一个结构化数据的就像Bigtable利用了Google文件系统（File System）所提供的分布式数据存储一样，HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库，它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。

2024-04-09 20:30:35 1216

原创 ZooKeeper的安装与操作

是一个分布式的、开放源码的分布式应用程序协调服务，它是的Chubby服务的开源实现，也是和等大数据生态系统中的重要组件。ZooKeeper的目标是为分布式应用提供一致性服务，包括配置维护、域名服务、分布式同步和组服务等。它封装了复杂且易出错的关键服务，通过简单的接口和高效、稳定的系统提供给用户。ZooKeeper的工作原理基于，该算法通过选举产生一个领导者（leader），只有领导者能提交proposer，以此来解决Paxos算法中可能存在的活锁问题。

2024-04-03 12:59:08 3692 2

原创没有基础？来这里看看，Python必做题（第3天）超级适合新手！！！！y

目录一.链表1.建立链表类实现链表的插入，增加，查找，删除，查看长度和打印的方法。链表的介绍如下：链表是一种物理存储单元上非连续、非顺序的存储结构，数据元素的逻辑顺序是通过链表中的指针链接次序实现的。链表中每一个元素称为结点，链表由一系列结点组成，结点可以在运行时动态生成。链表的每个结点包括两个部分：一个是存储数据元素的数据域，另一个是存储下一个结点地址的指针域。本次挑战中，你需要在 linkedlist.py 文件中补充类 Node 和类 LinkedList 的空缺部分。代码如下：

2024-01-28 10:00:00 442 1

原创没有基础？来这里看看，Python必做题（第2天）超级适合新手！！！！

【代码】没有基础？来这里看看，Python必做题（第2天）超级适合新手！！！！

2024-01-27 18:35:41 486 1

原创没有基础？来这里看看，Python必做题（第1天）超级适合新手！！！！

挑战介绍：实现一个算法来识别一个字符串的字符是否是唯一的。挑战内容：本次挑战中，你需要在 unique_chars.py 文件中补充函数 has_unique_chars 的空缺部分。 has_unique_chars 函数接受一个参数，string 用于指定传入的字符串; has_unique_chars 函数输出一个布尔值，即 True 或者 False。你需要补充 has_unique_chars 函数，使其可以识别传入的 string 字符串的字

2024-01-26 19:47:08 1013 1

m0_70988704的博客